This Page Is Inserted by IFW Operations 
and is not a part of the Official Record 

BEST AVAILABLE IMAGES 



Defective images within this document are accurate representations of 
the original documents submitted by the applicant. 

Defects in the images may include (but are hot limited to): 

• BLACK BORDERS 

• TEXT CUT OFF AT TOP, BOTTOM OR SIDES 

• FADED TEXT 

• ILLEGIBLE TEXT 

• SKEWED/SLANTED IMAGES 

• COLORED PHOTOS 

• BLACK OR VERY BLACK AND WHITE DARK PHOTOS 

• GRAY SCALE DOCUMENTS 

IMAGES ARE BEST AVAILABLE COPY. 



As rescanning documents will not correct images, 
please do not report the images to the 
Image Problem Mailbox. 



THIS PAGE BLANK (uspto) 



ORGANISATION MONDIALE DE LA PROPRIETE FNTELLECTUELLE 
Bureau international 




PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MATTE RE DE BREVETS (PCT) 



(51) Classification internationale des brevets 6 : 

C12N 15/53, 15A1, 15/82, 9/02, A01H 
5/00 



Al 



(11) Numero de publication internationale: WO 97/12982 
(43) Date de publication internationale: 10 avril 1997 (10.04.97) 



(21) NumeYo de la demande internationale: PCT/FR 96/0 1544 

(22) Date de de*pdt international: 3 octobrc 1996 (03.10.96) 



(30) Donnees relatives a la priorite*: 

95/1 1623 3 octobrc 1995 (03.10.95) 



FR 



(71) D^posants (pour ious les Etats designi s sauf US): CEN- 

TRE NATIONAL DE LA RECHERCHE SCIEN- 
TIFIQUE [FR/FR]; 3, rue Michel- Ange, F-75016 Paris 
(FR), INSTTTUT NATIONAL DE LA RECHERCHE 
AGRONOMIQUE [FR/FR]; 147, rue de V University 
F-75338 Paris C^dex 07 (FR). 

(72) Inventeurs; et 

(75) Inventeurs/D^posants (US seulement): BOUDET. Alain- 
Michel [FR/FR]; 18, rue Caubere. F-3I400 Toulouse 
(FR). PICHON, Magalie [FR/FR ]; En PeyTQulie\ F-31450 
Fourquevaux (FR). GR1MA-PETTENATI, Jacqueline 
[FR/FRJ; Rue de la Halle, F-31450 Fourquevaux (FR). 
BECKER T, Michel [FR/FR]; 11, rue des Bartissoux, 
F-63800 Coumon d'Auvergne (FR). GAMAS, Pascal 
[FR/FR]; 23. rue du Mont-Vallier, F-31240 TUnion (FR). 
BRIAT, Jean-Francois [FR/FR]; 116, rue de la Grange. 
F-34980 Saint-Ci6ment-de-Riviere (FR). 



(74) Mandataires: DEMACHY, Charles etc.; Grosset-Fournier & 
Demachy S.A.R.L.. 103. rue La Fayette, F-75481 Paris 
Cddex 10 (FR). 



(81) Etats de*signes: CA, JP. US, brevet europeen (AT, BE, CH, 
DE. DK, ES. FI, FR, GB, GR, IE. IT, LU. MC. NL, PT, 

SE). 



Publiee 



Avec rapport de recherche internationale. 

Avant r expiration du dilai privu pour la modification des 

revendications, sera republiee si de telles modifications sont 

recues. 



(54) Title: DNA SEQUENCES CODING FOR A CINNAMOYL CoA REDUCTASE. AND APPLICATIONS THEREOF IN THE 
CONTROL OF LIGNIN CONTENTS IN PLANTS 

(54) Titre: SEQUENCES D'ADN CODANT POUR UNE CINNAMOYL CoA REDUCTASE, ET LEURS APPLICATIONS DANS LE 
DOMAINE DE LA REGULATION DES TENEURS EN LIGNINES DES PLANTES 



(57) Abstract 

The present invention relates to any DNA sequence comprising as a coding region all or part of the nuclcotidic sequence coding for a 
mRNA coding coding for a cinnamoyl CoA reductase (CCR) in lucern and/or com, or all or part of the nucleotide sequence complementary 
of the latter and coding for an antisense mRNA susceptible of hybridizing with said mRNA. The invention also relates to the use of said 
sequences for implementing processes for the regulation of lignin biosynthesis in plants. 



(57) Abrege* 

La pnfsente invention conceme toute sequence d 1 ADN comprenant a titre de region codante. tout ou partie de la sequence nucleotidique 
codant pour un ARNm codant pour une cinnamoyl CoA reductase (CCR) chez la luzeme et/ou le mai's. ou tout ou partie de la sequence 
nucleotidique com pie" men ta ire de ces demieres et codant pour un ARNm antisens susceptible de s'hybrider avec TARNm susmentionne\ 
L 'invention vise £ga!ement l'utilisation des sequences susmentionne'es pour la mise en oeuvre de process de regulation de la biosynthese 
de lignines chez les plantes. 
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SEQUENCES D'ADN CODANT POUR UNE CINNAMOYL CoA 
REDUCTASE, ET LEURS APPLICATIONS DANS LE DOMAINE DE 
LA REGULATION DES TENEURS EN LIGMNES DES PL ANTES, 



La presente invention a pour objet l'utilisation de sequences d'ADN 
codant pour une cinnamoyl CoA reductase (CCR) chez les plantes. ou de tout 
fragment de ces sequences, ou encore de toute sequence derivee de ces 
dernieres. ou de leurs sequences complementaires. dans le cadre de la mise en 
oeuvre de procedes de regulation du taux de lignine chez les plantes. 

La lignine est un polymere aromatique heterogene complexe qui 
impermeabilise et renforce les parois de certaines cellules des plantes. 

La lignine est formee par polymerisation de radicaux libres derivant de 
monolignols tels que les alcools paracoumarylique, coniferylique et 
sinapylique (Higuchi, 1985, in Biosynthesis and degradation of wood 
components (T. Higuchi, ed), Academic Press, Orlando, FL, pp. 141-160). 

Les lignines presentent une grande variation dans leur contenu relatif en 
monolignols, en fonction des especes. et des differents tissus au sein d'une 
meme plante. 

Cette variation est probablement due et controlee par les differences 
activites et specificites de substrats, des enzymes necessaires a la biosynthese 
des monomeres de la lignine (Higuchi, 1985, susmentionne). 

Au-dela de son role dans la structure et le developpement des plantes, la 
lignine represente un composant majeur de la biomasse terrestre et revet une 
grande importance economique et ecologique (Brown, 1985, J. Appl. 
Biochem. 7, 371-387; Whetten and Sederoff. 1991, Forest Ecology and 
Management, 43, 301-316). 

Sur le plan de l'exploitation de la biomasse, il convient tout d'abord de 
noter que la lignine est un facteur limitant de la digestibilite et du rendement 
nutritionnel des plantes fourrageres. En effet, il est clairement demontre que la 
digestibilite des plantes fourrageres par les ruminants, est inversement 
proportionnelle a la teneur en lignines de ces plantes, la nature des lignines 
etant egalement un facteur determinant dans ce phenomene (Buxton and 
Roussel, 1988, Crop. ScL, 28, 553-558; Jung and Vogel, 1986, J. Anim., 
Sci., 62, 1703-1712). 

Parmi les principales plantes fourrageres chez lesquelles il serait 
interessant de diminuer les teneurs en lignines. on peut citer: luzerne, fetuque, 
mais, fourrage utilise en ensilage... 
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Reactions (K.V. Sarkanen and C.H. Kudwig eds) New York: Wiley - 
Interscience, pp. 1-18). 

Partant des cinnamoyls-CoA, la biosynthese des lignines chez les 
plantes. est effectuee de la maniere suivante: 
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La presente invention a pour objet ('utilisation de sequences 
nucleotidiques recombinantes contenant une (ou plusieurs) region(s) 
codante(s). cetie (ces) region(s) codante(s) etant constituee(s) dune sequence 
nucleotidique choisie parmi les suivantes: 

- la sequence nucleotidique representee par SEQ ID NO 1. codant pour 
un ARNm, cet ARNm codant lui-meme pour la cinnamoyi CoA reductase 
(CCR) de luzerne representee par SEQ ID NO 2. 

- la sequence nucleotidique representee par SEQ ID NO 3. codant pour 
un ARNm, cet ARNm codant lui-meme pour la CCR de mais representee par 
SEQ ID NO 4. 

- un fragment de la sequence nucleotidique representee par 
SEQ ID NO 1, ou de celle representee par SEQ ID NO 3, ce fragment codant 
pour un fragment de la CCR representee par SEQ ID NO 2 ou pour un 
fragment de la CCR representee par SEQ ID NO 3. respect ivement, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle des 
deux CCR susmentionnees, 

- la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1 ou SEQ ID NO 3. cette sequence complementaire codant pour 
un ARNm antisens susceptible de s'hybrider avec 1'ARNm code par les 
sequences SEQ ID NO 1 et SEQ ID NO 3, respectivemenL 

- un fragment de la sequence nucleotidique complementaire de celle 
representee par SEQ ID NO 1 ou SEQ ID NO 3. ce fragment de sequence 
codant pour un ARNm antisens susceptible de s'hybrider avec I'ARNm codant 
lui-meme pour la CCR representee par SEQ ID NO 2. ou avec 1' ARNm 
codant lui-meme pour la CCR representee par SEQ ID NO 4, respectivement, 

- la sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 ou SEQ ID NO 3, notamment par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
derivee codant soit pour un ARNm codant lui-meme pour la CCR representee 
par SEQ ID NO 2 ou SEQ ID NO 4 respectivement, ou pour un fragment ou 
une proteine derivee de ces dernieres, ce fragment ou proteine derivee 
presentant une activite enzymatique equivalente a celle desdites CCR chez les 
plantes, 

- la sequence nucleotidique derivee de la sequence nucleotidique 
complementaire susmentionnee, ou du fragment de cette sequence 
complementaire tel que decrit ci-dessus, par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
derivee codant pour un ARNm antisens susceptible de s'hybrider avec un des 
ARNm susmentionnes. 
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fragment de CCR presentant une activite enzymatique equivalence a celle de la 
CCR susmentionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 3, susmentionnee, ou d'un fragment te] que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substiaition d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 4. 
ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

Par proteine presentant une activite enzymatique equivalente a celle des 
CCR presentes chez les plantes, et plus particulierement des CCR representees 
par SEQ ID NO 2 et SEQ ID NO 4, on emend toute proteine possedant une 
activite CCR telle que mesuree selon la methode de Luderitz et Grisebach 
publieedans Eur. J. Biochem. (1981), 119: 115-127. 

A titre d* illustration, cette methode est realisee par mesure 
spectrophotometrique de I'activite reductrice de la proteine (CCR ou derivee), 
en suivant la disparition des cinnamoyl CoA a 366 nm. La reaction se deroule 
a 30°C, pendant 2 a 10 minutes. La composition du milieu reactionnel est la 
suivante: tampon phosphate 100 mM, pH 6.25, 0,1 mM NADPH, 70 /xM 
FeruloyI CoA, 5 a 100 fi\ dextrait enzymatique dans un volume total de 
500 pi. 

L'invention a egalement pour objet toute sequence d'ADN, caracterisee 
en ce qu'elle comprend a titre de region codante: 

- la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1, cette sequence complementaire codant pour un ARNm antisens 
susceptible de s'hybrider avec l'ARNm codant lui-meme pour la CCR 
representee par SEQ ID NO 2, a savoir l'ARNm code par la sequence 
representee par SEQ ID NO 1, ou code par une sequence derivee de cette 
derniere, telle que definie ci-dessus, ou 

- un fragment de la sequence complementaire susmentionnee, ce 
fragment de sequence codant pour un ARNm antisens susceptible de 
s'hybrider avec l'ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, tel que defini ci-dessus, ou 

- toute sequence nucleotidique derivee de la sequence complementaire 
susmentionnee, ou du fragment de cette sequence complementaire tel que " 
decrit ci-dessus, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substiaition d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm antisens susceptible de s'hybrider avec l'ARNm susmentionne. 
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sequence codant pour une CCR (ou fragment de CCR ou proteine derivee), ce 
dernier ARNm etant encore designe ARNm sens (5" -> 3'). 

Le terme d'ARN antisens s'adresse done a une sequence d'ARN 
complementaire de la sequence en bases de TARN messager. le terme 
complementaire devant etre compris en ce sens que chaque base (ou une 
majorite de bases) de la sequence antisens (lue dans le sens 3' 5') est 
capable de s'apparier avec les bases correspondantes (G avec C, A avec U) de 
1ARN messager (sequence lue dans le sens 5' 3' ). 

La strategic des ARN antisens, dans le cadre de la presente invention. 
Mi est une approche moleculaire particulierement adaptee a I'objectif d'une 
modulation des taux de lignines des plantes. L' ARN antisens est un ARN 
produit par la transcription du brin d'ADN non codant (brin non-sens). 

Cette strategic antisens est plus particulierement decrite dans le brevet 
europeen n c 240 208. 

15 On pense que ('inhibition de la synthese d'une proteine selon la strategic 

antisens. en I'occurrence de la CCR dans le cas present, est la consequence de 
la formation d un duplex entre les deux ARN complementaires (sens et 
antisens) empechant ainsi la production de la proteine. Le mecanisme 
cependant reste obscur. Le complexe ARN-ARN peut interferer soit avec une 

20 transcription ulterieure, soit avec la maturation, le transport ou la traduction 
ou bien encore conduire a une degradation de I'ARNm. 

Une combinaison de ces effets est egalement possible. 
L' invention concerne egalement tout ARNm code par une sequence 
d'ADN selon 1' invention, et plus particulierement: 

- s - 1' ARNm code par la sequence d'ADN representee par SEQ ID NO 1, 

ou code par un fragment ou une sequence derivee tels que definis ci-dessus, 
iedit ARNm etant susceptible de coder a son tour pour la CCR presente chez 
la luzerne. telle que representee par SEQ ID NO 2, ou pour un fragment de 
cette CCR ou une proteine derivee tels que definis ci-dessus. 

3° - I'ARNm code par la sequence d'ADN representee par SEQ ID NO 3, 

ou code par un fragment ou une sequence derivee tels que definis ci-dessus, 
ledit ARNm etant susceptible de coder a son tour pour la CCR presente chez 
le mais, telle que representee par SEQ ID NO 4, ou pour un fragment de cette 
CCR ou une proteine derivee tels que definis ci-dessus. 

3? L' invention a egalement pour objet tout ARNm antisens, tel que defini 

ci-dessus, caracterise en ce qu'il comprend des nucleotides complementaires 
de la totalite ou d'une partie seulement des nucleotides constituant un ARNm 
tel que decrit ci-dessus selon ['invention, ledit ARNm antisens etant 
susceptible de s'hybrider (ou de s'apparier) avec ce dernier. 



/ 



10 



15 



2o 



30 



WO 97/12982 

PCT/FR96/01 544 

**°» * 50 bases „o m o,ol ' T ~ C ° mP ™"' »«*» "* 

«- P o:/r; R ;'::L: p ::;v e ,ai,,e pour ies — 

'ongues que ce„es du messZ „ , PeUVeM 6lre «»* 

,o„ sue s que „ £ 12ZZ7 T" "'^ ^ ^ 

CCR. ° N - eenom '1^ Mdant pour lARNm de la 

Avamageusemem. de relies sequences d'ADN ,„„ 
an.isens selon I'inven.ion co m P ° Ur un AR N 

1000 paires debases """'«"»« «« environ ,00 e, env ir0 „ 

<°J;:::z:z:;:%z: ■ pour objet ,ouk ^ ~ 

fragment, de ce, Ls, ARM ^ dfcri ' ,S ' C '- d «^- «• 

fences bordan u ™^ ^ £ 8 des 

"■un des ARNm de l invemion r, rePreSeman ' C ' U «■ A) comprises dans 

<Hase,off ,. „ Ge , ^ ^"T" ^ ™ 

... L "' iyss - Nature, 334: 585-591) 

,nventlon concerne egalement toute sequence d' ADM 
coder pour une sequence antisens telle an. ^ ADN suscepnble de 

-.ns un do.aine cataIytique " ^ ^ --us comprena. au 
anusens de .'invention, ou fra g ment(s) 7ZZ " " ^ 

-stents environ S b asesl, sq r^:i~ nS 
,nventlon a plus particuiierement pour objet 
- tout ARNm antisens. tel que derrir ^; a 

s ^ ; a 0 r:; -~r sr-srs 

code p r rul a e m I« " ^ C «** « « « 

SEQ D NO 3 t ark ' C ° mP *~ * «„e represen.ee par 

' ARNm code par * ^""dT **" SUSCeP ' ib ' e * "«« 
P sequence d ADN representee par SEQ ID NO 3 

* ^~:rN £ T;!:::r rr** ~~ - 



OID: <WO 9712982A1 J_> 



WO 97/12982 



PCT/FR96/01544 



-II- 



plantes. et plus particulierement les CCR recombinantes codecs par Jes 
sequences representees par SEQ ID NO 1 et SEQ ID NO 3. ou par des 
sequences derivees de ces dernieres selon 1' invention. 

L' invention a plus particulierement pour objet les polypeptides 
recombinants, et notamment les CCR recombinantes. tels qu'obtenus par 
transformation de cellules vegetales en integrant de fagon stable dans leur 
genome, une sequence nucleotidique recombinante telle que definie ci-apres, 
contenant une sequence d'ADN selon I' invention, notamment a l'aide d'un 
vecteur tel que decrit ci-apres. 

Par 1'expression "polypeptides recombinants", on doit entendre toute 
molecule possedant une chaine polypeptidique susceptible d'etre produite par 
genie genetique, par 1' intermediate d'une phase de transcription de I'ADN du 
gene correspondant, ce qui conduit a 1'obtention d'ARN qui est par la suite 
transforms en ARNm (par suppression des introns). ce dernier etant ensuite 
traduit par les ribosomes, sous forme de proteines. le tout etant effectue sous 
controle d'elements de regulation appropries a l'interieur d'une cellule hote. 
Par consequent, 1'expression "polypeptides recombinants" utilisee n'exclut pas 
la possibility que lesdits polypeptides comprennent d'autres groupements. tels 
que les groupements glycosyles. 

Bien entendu, le terme "recombinant" indique que le polypeptide a ete 
produit par genie genetique, car il resulte de 1'expression. dans un hote 
cellulaire approprie, de la sequence nucleotidique correspondante qui a ete 
auparavant introduite dans un vecteur d'expression utilise pour transformer 
ledit hote cellulaire. Toutefois. ce terme "recombinant" n'exclut pas la 
possibility que le polypeptide soit produit par un procede different, par 
exemple par synthese chimique classique selon les methodes connues utilisees 
pour la synthese de proteines, ou par clivage proteolytique de molecules de 
plus grande taille. 

L' invention concerne plus particulierement la CCR telle que presente 
dans les cellules de luzerne et representee par SEQ ID NO 2 ou la CCR telle 
que presente dans les cellules de mais et representee par SEQ ID NO 4. 
lesdites CCR etant telles qu'obtenues sous forme essentiellement pure par 
extraction et purification a partir de luzerne ou de mais, ou toute proteine 
derivee de ces dernieres, notamment par addition, et/ou suppression, et/ou 
substitution d'un ou plusieurs acides amines, ou tout fragment issu desdites 
CCR ou de leurs sequences derivees, lesdits fragments et sequences derivees 
etant susceptibles de posseder une activite enzymatique equivalente a celle des 
CCR susmentionnees. 



WO 97/12982 ^_ ^_ 

PCT/FR96/01544 

L- invention a egalement pour objet les sequences nucleotidiques codant 
pour la CCR representee par SEQ ID NO 2 ou SEQ ID NO 4. ou toute 
•sequence denvee ou fragment de ces dernieres. tels que definis ci-dessus 
lesdnes sequences nucleotidiques etant caracterisees en ce qu'elles 
correspondent a tout ou partie des sequences representees par SEQ ID NO 1 
ou SEQ ID NO 3 respect.vemem. ou a toute sequence derivee de ces dernieres 
par degenerescence du code genet.que. et etant neanmoins susceptibles de 
coder pour les CCR ou sequence derivee ou fragment de ces dernieres ' tels 
que definis ci-dessus. 

L'invention vise egalement les complexes formes entre les ARNm 
ant.sens. tels que decrits ci-dessus, et les ARNm selon I'invenuon 
suscept.bles de coder pour tout ou partie dune CCR chez les plantes 

L'invention a plus particulierement pour objet le complexe forme entre 
I'ARNm code par la sequence SEQ ID NO 1 et . ARNm antisens code par la 
sequence complement de la sequence SEQ ID NO I . ainsi que le complexe 
forme entre I'ARNm code par la sequence SEQ ID NO 3 et I'ARNm ant.sens 
code par la sequence complementaire de la sequence SEQ ID NO 3. 

L'invention a plus particulierement pour objet toute sequence 
nucleotid.que recombmante (ou ADN recombinant), caracterisee en ce qu elle 
comprend au moins une sequence d'ADN selon l'invention, cho.sie parmi 
celles decrites ci-dessus, ladite sequence d'ADN etant inseree dans une 
sequence heterologue. 

L'invention concerne plus particulierement toute sequence nucleotidique 
recombinante telle que decrite ci-dessus. comprenant. a titre de resion 
codante, la sequence nucleotidique representee par SEQ ID NO 1. ou par 
SEQ ID NO 3, ou tout fragment ou une sequence nucleotidique derivee de ces 
dernieres, tels que definis ci-dessus, lesdites sequences nucleotidiques ou ledit 
fragment etant inseres dans une sequence heterologue, et etant susceptibles de 
coder pour la CCR representee par SEQ ID NO 2, ou par SEQ ID NO 4 
respecttvement, ou pour Un fragment de ces CCR, ou pour une proteine 
denvee de ces dernieres, tels que definis ci-dessus. 

L'invention concerne plus particulierement encore, toute sequence 
nucleot,d,que recombinante comprenant, a utre de region codante une 
sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1, ou par SEQ ID NO 3, ou tout fragment ou toute sequence 
nucleottdtque derivee de cette sequence complementaire. tels que definis ci- 
dessus. lesdues sequences complementaires ou ledit fraement etant inseres 
dans une sequence heterologue, et etant susceptibles de coder pour un ARNm 
ant.sens capable de s'hybrider avec tout ou partie de I'ARNm codant pour une 
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CCR chez les plantes. et plus particulierement avec tout ou partie de I'ARNm 
codant pour la CCR representee par SEQ ID NO 2, ou par SEQ ID NO 4. 

Les ADN recombinants selon 1' invention sont davantage caracterises en 
ce quiis comprennent les elements necessaires pour reguler lexpression de la 
sequence nucleotidique codant pour une CCR, ou de sa sequence 
complementaire codant pour un ARNm antisens selon V invention, notamment 
un promoteur et un terminateur de la transcription de ces sequences. 

Parmi les differents promoteurs susceptibles d'etre utilises dans les 
constructions d'ADN recombinants selon I 'invention, on peut citer: 

- le promoteur endogene controlant 1'expression de la CCR chez une 
plante. notamment le promoteur situe en amont de la sequence d'ADN 
representee par SEQ ID NO 5 codant chez I eucalyptus pour la CCR 
representee par SEQ ID NO 6, ou 

- des promoteurs de type constitutif a forte expression, exemples: 
3:) S CAMV (decrit dans Benfey et al. (1990). EMBO J.. 9 (6). 1677-1684). 
EFla (promoteur du gene d un facteur d 'elongation dans la synthese proteique 
decrit par Curie et al. (1991). Nucl. Acids Res., 19. 1305-1310). 

- des promoteurs de type specifique a expression particuliere dans des 
tissus individuels, exemples: promoteur CAD (decrit par Feuillet C. (1993). 
These de 1'Universite de Toulouse III), promoteur GRP 1-8 (decrit par Keller 
et Baumgartner, (1991), Plant Cell., 3, 1051-1061) a. expression dans des 
tissus vasculaires specifiques. 

L'invention concerne egalement toute sequence nucleotidique 
recombinante telle que decrite ci-dessus, et comprenant egalement a titre de 
region codante au moins une sequence nucleotidique codant pour tout ou partie 
d un ARNm codant lui-meme pour une autre enzyme que la CCR, qui se 
trouve etre impliquee dans une etape de la biosynthese des lignines chez les 
plantes, notamment I'ARNm codant pour I'alcool cinnamylique 
deshydrogenase (CAD), ou comprenant egalement a titre de region codante au 
moins une sequence nucleotidique codant pour tout ou partie d'un ARNm 
antisens susceptible de s'hybrider avec I'ARNm susmencionne. notamment 
avec I'ARNm codant pour la CAD. 

Les sequences nucleotidiques recombinantes susmentionnees de 
['invention sont avantageusement obtenues a partir de vecteurs dans lesquels 
sont inserees les sequences d'ADN codant pour une enzyme necessaire a la 
biosynthese des lignines chez les plantes. 

Les vecteurs susmentionnes sont digeres a I'aide d'enzymes de 
restriction appropriees afin de recuperer lesdites sequences d'ADN qui s'y 
trouvent inserees. 
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Ces dermeres sent ensuite inserees en aval cTun promoteur appropne ec 
en amont d un terminate approprie de ,'expression. au sein des ADN 
recombinants selon 1' invention. N 

^invention vise plus particulierement les ADN recomhi 

H CIlce a AU1\ de I invention et insertion de cette 
dern.ere dans ,e sens 5- - 3'. au sein d'une sequence d'ADN be,^ 
cenprenan. un promoteur e, un KrmmaKm de ..^^ de 

L invention a egalemen, plus paniculieremem pour obje, les ADN 
recomb.nan.s comprenant ,a sequence comp,™e„,a,re de la s*que„le 
represen.ee par SEQ ID NO 1. „u de celle represen.ee par SEQ ,D NO ,e 
qu ob.enus par diges.ion de vec.eurs susment.onnes, rjpera.ion de 1 
sequence d'ADN de ,'inven.ion. e, insen.on de ce.te dern.re I sens invl 

omn ~™ 5 ' " Se ' n d ' Une d'ADN ne.erologue 

comp e„a„, un promoreur e. un .erminareur de ( expression de ,a sequence 

complementaire. H 

A .i.re d'exemple de .ermina.eur u.ilisable dans de relies cons.rucons 

Ainsi. dune mamere generate, les sequences nucleo.idiques 
ec 0 ^,„a nl es selon ,'inven.ion. covenant une sequence d'ADN codan, pour 
une CCR (ou fragment de CCR ou proteine der.vee). et/ou dau.res enzvmes 

- ladT a " eS 3 '\ bi0SyMMSe d « ™» ^.enues par Operation de 

- a .e sequence d'ADN a partir des vec.eurs susmen.ionnes. e, ,„ser,,o„ de 

ceue sequence dans la sequence ne.erologue. .and.s que les sequences 

nucleosides recombinan.es con.enan, une sequence d'ADN codan. ^our un 

ARNm annsens selon ,'inven.ion, son. obtenus par r,cup<ra,,o„ de ,a sequence 

ADN susmennonnee e. insenion en sens inverse de ce„e dern,ere dans ladi.e 
>° sequence heterologue. 

A titre d'illustration. on peut utiliser tout ou partie de l'ADN 
complement™ (ADNc) represent par SEQ ID NO 1 ou SEQ ID NO 3 pour 
1. con Slruction des ADN recombinants susment.onnes. ou bien tout ou partie 
du clone genomique correspondant a une CCR (qui correspond aux ADNc 
susment.onnes + d'eventuels introns). Ce clone genomique peut etre obtenu 
en ut.hsant ,es ADNc comme sondes pour crib.er une banque genomique. cette 

F ^ eMe : m6me ° btenUe SUiV3nt ' a ^ ^ slbroo,. 

Fntsch « Man.at.s, Mo.ecu, ar Coning Laboratory Manual. Co.d Sprino 

Harbour Laboratory Press, 1989. p c 
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L" invention a egalement pour objet tout vecteur recombinant, utilisable 
pour la transformation de plantes, caracterise en ce qu'il comprend une 
sequence nucleotidique recombinante choisie parmi celles decrites ci-dessus. 
selon l'invention, integree dans Tun des sites de son genome non essentiels 
pour sa replication. 

Parmi les vecteurs recombinants susmentionnes utilisables pour la 
transformation de plantes. on peut citer: les vecteurs binaires derives de pBIN 
19 (Bevan et ai., (1984). Nucl. Acids Res.. 12 (22). 871 1-8721). 

Des exemples de construction de vecteurs recombinants selon I 'invention 
sont decrits dans la description detaillee qui suit de ('invention. 

La presente invention a egalement pour objet un procede de regulation 
de la biosynthese des lignines chez les plantes, soit par diminution, soit par 
augmentation des quantites de lignines produites. par rapport aux quantites 
normales de lignines produites chez ces plantes, ledit procede comprenant une 
etape de transformation de cellules de ces plantes a I'aide d'un vecteur 
contenant: 

- la sequence nucleotidique representee par SEQ ID NO 1 ou par SEQ 
ID NO 3 ou un fragment des sequences nucleotidiques susmentionnees, ce 
fragment codant pour un ARNm, cet ARNm codant lui-meme pour un 
fragment d'une CCR chez les plantes, ce fragment de CCR presentant une 
activite enzymatique equivalente a celle de la CCR representee par SEQ ID 
NO 2 ou par SEQ ID NO 4. ou d une sequence nucleotidique derivee des 
sequences nucleotidiques susmentionnees. ou derivee du fragment 
susmentionne. notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm, cet ARNm codant lui-meme pour une proteine derivee 
presentant une activite enzymatique equivalente a celle de Tune au moins des 
CCR susmentionnees. ou 

- une sequence nucleotidique complementaire de tout ou partie des 
sequences nucleotidiques representees par SEQ ID NO 1 ou par SEQ ID NO 3 
codant pour un ARNm, ou du fragment de ces sequences, ou de la sequence 
derivee de ces derniers, tels que definis ci-dessus. cette sequence 
complementaire codant pour un ARNm antisens susceptible de s'hybrider avec 
l'un des ARNm susmentionnes. 

ladite transformation etant effectuee notamment a I'aide d'un vecteur tel que 
decrit ci-dessus. 

L* invention a plus particulierement pour objet un procede de diminution 
de la quantite de lignines produites par biosynthese chez les plantes. ce 
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precede etant effectue par transformation du genome de ces planter en v 
incorporant: 

- au moins une sequence d'ADN selon Invention telle que decrite c, 
dessus codant pour un ARNm antisens susceptible de shybrider avec rout ou 

ID NO 4 ^ C ° dam P ° Ur 13 r£P ™ P - SE * ID ™ ' ou SEQ 
dessus ° U P ° Ur Pr0t " ne ^ dern ^ eS te " e *** ^"ie ci- 

- et. le cas echeant, au moins une sequence d'ADN cod ant pour un 
ARNm anusens capable de s'hybrider a un ARNm codant pour une autre 
enzyme que la CCR, qui se tr0U ve etre imp.iquee dans une etape de la 
b,osynthese des Hgnmes chez les plantes. notamment I'ARNm codant pour la 

ladite transformation etant realisee: 

- soil a l'aide d'un vecteur recombinant tel que decrit ci-dessus 
contenant une sequence d'ADN codant pour un ARNm anusens capable de 
s hybnder avec I'ARNm codant pour la CCR ou pour une proteine denvee 
telle que definie ci-dessus. et, le cas echeant, contenant une ou plusieurs 
sequence(s) d'ADN codant pour un ARNm antisens capab.e de s'hvbrider a un 
ARNm codant pour une autre enzyme que la CCR telle que definie'ei-dessus 

- sou a l'aide de plusieurs vecteurs recombinants dont 1'un au moins 
conuent une sequence d'ADN codant pour un ARNm anusens capab.e de 
s hybrider avec I'ARNm codant pour la CCR ou poU r une proteine derivee 
telle que definie ci-dessus, tandis que 1' ( OU les) autre(s) vecteur^ 
recomb,n an t(s) contien(nen)t une sequence d'ADN codant pour un ARNm 
anusens capable de s'hybr.der a un ARNm codant pour une autre enzvme que 
la CCR, telle que definie ci-dessus. 

Un autre procede de diminution de la quantite de Hgnines produues par 
b.osynthese chez les plantes, est celui realise par transformation du eenome de 
ces plantes, en y incorporant: 

« n rn a r ™ inS S ' qU6nCe d ' ADN Se, ° n nnventi °n representee par 

ID N ° 1 ° U S£ Q ID NO 3 - ou un fragment ou une sequence denvee de 
cette dermere, tels que definis ci-dessus, 

- et. le cas echeant, au moins une sequence d'ADN codant pour tout ou 
parue d une autre enzyme que la CCR. qui se trouve etre impliquee dans une 
etape de la btosynthese des Hgnines chez les plantes. notamment une sequence 
d ADN codant pour tout ou partie de la CAD. 

iadite transformation etant realisee. 

- soit a l'aide d'un vecteur recombinant tel que decrit ci-dessus 
contenant la sequence d'ADN selon Invention susmemionnee. ou un fragment 
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ou une sequence derivee de cette derniere. tels que definis ci-dessus, et. le cas 
echeam. contenant une ou plusieurs sequence(s) d'ADN codant pour tout ou 
partie dune enzyme autre que la CCR. telle que definie ci-dessus. 

- soit a I'aide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence d'ADN selon Invention susmentionnee, ou un 
fragment ou une sequence derivee de cette derniere. tels que definis ci-dessus. 
tandis que I' (ou les) autre(s) vecteur(s) recombinant^ ) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR. 
telle que definie ci-dessus. 

Cette derniere methode fait appel au mecanisme de co-suppression. La 
co-suppression a ete observee quand des copies du gene endogene ont ete 
mtroduites dans le genome. Bien que le mecanisme de la co-suppression soit 
actuellement inconnu. une des hypotheses les plus frequemment retenue est 
que la regulation negative de l'expression du gene v.endrait de la production 
d'une faible proportion d'ARN antisens derivee d'un transgene a travers une 
lecture du "mauvais" brin du transgene (Grierson et a!.. Trends Biotech 9 
122-123). 

L' invention a egalement pour objet un procede de diminution de la 
quantite de lignines produites par biosynthese chez les plantes, ce procede 
etant realise par transformation du genome de ces plantes en y incorporant une 
sequence d'ADN telle que decrite ci-dessus selon I'invention. codant pour une 
sequence antisens comprenant un (ou plusieurs) domaine(s) catalytique(s) d'un 
ribozyme lie(s) a un (ou plusieurs) ARNm antisens, ou fragment(s) d'ARNm 
antisens de I'invention. Iadite transformation etant realisee a I'aide d'un 
vecteur recombinant comprenant une sequence nucleotidique recombinante 
selon I'invention contenant elle-meme la sequence d'ADN susmentionnee. 

II est important de noter que les methodes susmentionnees permettent 
d aboutir a des plantes transformees presentam des niveaux differents de 
reduction de 1'activite CCR (selon le niveau d'insertion de la sequence d'ADN 
codant pour l'ARNm antisens. le nombre de copies de cette sequence d'ADN 
integree dans le genome...), et done des teneurs en lignines. 

Le choix des transformants permettra done une modulation controlee des 
teneurs en lignines compatible avec un developpement normal de la plante. 

D'une maniere generale, si Ton considere que la teneur moyenne 
normale en lignines d'une plante varie entre environ 15% et environ 35% en ' 
poids de matiere seche, la reduction de la teneur en lignines resultant de la 
mise en oeuvre d'un des procedes susmentionnes. est avantageusement telle 
que les plantes ainsi transformees presentent une teneur moyenne en lignines 
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variant entre environ 10% et environ 30%. ou encore entre environ P% et 
environ 32% . 

A titre d'illustration, la teneur en lignines d'une plante peut etre mesuree 
selon une variante de la methode de Johnson et al.. (1961) T A P P I 44 
793-798. qui est decrite en detail dans Alibert et Boudet (1979) Phvsiol ' 
Vcg., 17 (1,. 67-74. et dont les principales etapes sont les suivantes-'apres 
obtentton d'une poudre alcool benzene contenant .es N Sn ines du materiel 
vegetal, les lign.nes sont so.ubi.isees par le bromure d'acetvle et dosees en 
fonction de leur absorption dans I'ultraviolet. 

^invention vise plus panicu.ierement Implication des procedes 
susmentionnes de diminution des teneurs en lignines dans les p, ant e S a 
I obtenuon de plantes fourrageres transformees genetiquement. presentant des 
teneurs en lignines reduites par rapport aux teneurs normales en li 2 nines chez 
ces plantes. et dont la digestibilite se trouve etre ainsi amelioree pa~r rapport a 
^ ces memes plantes non transformees. 

Parmi les principa.es plantes fourrageres susceptibles d'etre transformees 
dans le cadre de la presente invention, on peut citer: la luzerne, la feruque le 
mais destine a l'ensilage, etc... 
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L invention concerne egalement Implication des procedes 
susmentionnes de diminution des teneurs en lignmes chez les plantes a 
I obtenuon de plantes. et plus particulierement d'arbres. transforms 
genetiquement, presentant des teneurs en lignines reduites par rapport aux 
teneurs normales en lignines che Z ces plantes. ces plantes ou arbres etant 
particulierement avantageux a utiliser dans le cadre de la production de la pate 
a papier. p 

Un troisieme domaine potentiel duplication des procedes 
susmentionnes de regulation negative de 1 'expression du gene de la CCR 
concerne la stimulation de la croissance des plantes transformees Divers 
arguments soulignent (Sauter et Kende, 1992. Plant and Cell Physiology 33 
(8): 1089), qu'une lignification precoce et rapide est une frein au grandissement 
cellulaire et done a la cro.ssance des vegetaux. Ainsi la mise en oeuvre des 
procedes susmentionnes est susceptible de permettre pour les plantes ainsi 
transformees a lignification reduite une mei.leure croissance et done de 
meilleurs rendements. 

Lmvention concerne egalement un procede d' augmentation de la 
quantite de lignines produites par biosynthese chez les plantes, ce procede 
etant effecrue par transformation du genome de ces plantes. en v incorporant 
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- au moins une sequence d'ADN selon i' invention representee par 
SEQ ID NO 1 ou SEQ ID NO 3. ou un fragment ou une sequence derivee de 
cette derniere. tels que definis ci-dessus. 

- eL le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d'une autre enzyme que la CCR, qui se trouve etre impliquee dans une 
etape de la biosynthese des lignines chez les plantes. notamment une sequence 
d'ADN codant pour tout ou partie de la CAD, 

ladite transformation etant realisee: 

- soit a I'aide d'un vecteur recombinant tel que decrit ci-dessus, 
contenant la sequence d'ADN selon I' invention susmentionnee, ou un fragment 
ou une sequence derivee de cette derniere, tels que definis ci-dessus, et, le cas 
echeant. contenant une ou plusieurs sequence(s) d'ADN codant pour tout ou 
partie d'une enzyme autre que la CCR, telle que definie ci-dessus. 

- soit a I'aide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence d'ADN selon l'invention susmentionnee, ou un 
fragment ou une sequence derivee de cette derniere, tels que definis ci-dessus, 
tandis que 1' (ou les) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR, 
telle que definie ci-dessus. 

D une maniere generate, toujours si Ton considere que la teneur 
moyenne normale en lignines d'une plante varie entre environ 15% et environ 
35% en poids de matiere seche, l'augmentation de la teneur en lignines 
resultant de la mise en oeuvre du procede susmentionne. est avantageusement 
telle que les plantes ainsi transformees presentent une teneur moyenne en 
lignines variant entre environ 20% et environ 40%. ou encore entre environ 
18% et environ 38%. 

L'invention vise plus particulierement lapplication du procede 
susmentionne d' augmentation des teneurs en lignines dans les plantes (encore 
designe procede de surexpression du gene de la CCR), a 1'obtention de plantes 
transformees genetiquement, presentant des teneurs en lignines augmentees par 
rapport aux teneurs normales en lignines chez ces plantes, et dont les 
proprietes de resistance a des attaques de I'environnement, notamment a des 
attaques parasitaires, se trouvent etre ainsi ameliorees par rapport a ces memes 
plantes non transformees. H est particulierement avantageux dans ce dernier 
cas, d'utiliser en association avec le gene CCR, ou une sequence derivee, dans 
les vecteurs susmentionnes, des promoteurs specifiques particulierement 
exprimes dans les tissus de surface et/ou en reponse a la blessure. 

Par ailleurs, Tinvention concerne egalement Tapplication du procede 
susmentionne de surexpression du gene de la CCR. a l amelioration de la 
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croissance des pl an,es amsi transformees gene„, U ement. Mlmmen dans 
~ ««• ,ue r„o„,cu„ure ou rarbortcuhure. ou , « 

souha.table dobtemr des plantes de dimension reduite 

Enfm. ies cycles benzeniques de la lignine on, une plus grande energie 
mtrmseoue que ,es chaines aiiphatiques des restdus glucose de la ce, o 
Amst. I animation de !a proportion de ,i g „i„e S chez ies vege,aux ,^s 
omme combustibles, selon ie precede susmentionne de l invemion oe ™ 

--rer ,e „ energ^e de ces ^ C JZLTZ 

Dans Ies deux cas de regulation negative ou de suppression de la CCR 
« »u. a fan envisageab.e cue ia modulat.on de ce.te acivite se r P e^e 
sur ,a teneur en ,,g„,nes des P ,a„tes transform*, En effet. ,a CCR d T 
ntveau d acttv.te es, tres bas dans ,a p.ante. semble constt.uer lenz vm 
regulatnce de la synthese des lignines. 

S'agissan, des techntques de transformation u.ilisees pour la m,se en 
ueuvre dun des precedes decr.ts c-dessus de .'invention, on au 
avantageusement recours aux techniques suivantes: 

A) La technologie de transformation par I'intermediaire du plasmide T, 

J- 87H ZTZt BeVa " " 984> Nudc ' C Ac '« R-arcb. 
1- 8711-8721. Elle f a „ apP el essen.iellement a la methode de co-culrure e, 

a„ mtervenir une ^-transformation avec un gene de section pour pouvoir 
reperer Ies transformants. 

^erTooZ P "' i0M ~ ™ l ™ b * «« ^-tyMdones. ex, tabac. 

detail l L r a 7 'T iqUe ^ ,ramfe " d ' reC1 * 8 = n " P " bi °"^ - 
detail par (Zumbrum e, al.. 1989. Technique 1. 204-216; Sanford e, al 199, 

Technique 3. 3-16). ' 
Cetee technique tmplique l association de I'ADN recombinant selon 
tnven»„ a des m.croparticules d'or ou de tungstene qui sont propulsees a 
a,de d un canon a particules sur le tissu a transformer. Elle sera 

parttculteremen, appliquee a la transformation d especes requires aux 

agrobactenes. 

Dans les deux cas susmentionnes, la verification de la presence de 

d'th H rCCOn ! ,nant Sd0n nnVemi0n ^ ^ des -Ponces 

eactt ° n C !f Pe S0Uthern " d ' amp,ifiCation ****** (Pdy-rase chain 
reacuon). a , a ,de de sondes et d'amorces o.igonucleotidiques issues 
notamment de la sequence SEQ ID NO 1 ou SEQ ID NO 3 
^ ^invention concerne egalement les cellules de p.antes transformees par 
un veaeur selon invention, notamment par ,es techniques decntes ci-dessus. 
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et comprenant une sequence d'ADN selon 1' invention integree de facon stable 
dans leur genome. 

L" invention vise egalement les plantes transformees telles qu'obtenues 
par culture des cellules transformees susmentionnees. 

Les plantes transformees peuvent etre ensuite propagees par voie 
sexuelle ou par voie vegetative in vitro ou in natura. 

L' invention a egalement pour objet les fragments de plantes. notamment 
fruits, semences. pollen, transformes par incorporation dans leur genome 
d'une sequence d'ADN selon 1'invention. a l'aide des vecteurs recombinants 
susmentionnes. 

L' invention concerne egalement les anticorps diriges contre les 
polypeptides recombinants de I invention, et plus particulierement ceux diriges 
contre les CCR recombinantes susmentionnees. 

De tels anticorps peuvent etre obtenus par immunisation d'un animal 
avec ces polypeptides suivie de la recuperation des anticorps formes. 

II va de soi que cette production n'est pas limitee aux anticorps 
polyclonaux. 

Elle s'applique encore a tout anticorps monoclonal produit par tout 
hybridome susceptible d'etre forme, par des methodes classiques, a partir des 
cellules spleniques d un animal, notamment de souris ou de rat. immunises 
contre l un des polypeptides purifies de 1'invention d'une part, et des cellules 
d'un myelome approprie d'autre part, et d'etre selectionne, par sa capacite a 
produire des anticorps monoclonaux reconnaissant le polypeptide 
susmentionne initialement mis en oeuvre pour rimmunisation des animaux. 

L' invention vise egalement 1 'utilisation des anticorps susmentionnes 
diriges contre les polypeptides recombinants de 1'invention, pour la mise en 
oeuvre d'une methode de detection ou de dosage des CCR chez les plantes. a 
partir d'echantillons preleves chez ces dernieres. 

II convient de preciser que sont exclues des sequences nucleotidiques de 
1'invention et de leur utilisation susmentionnee, les sequences nucleotidiques 
representees par SEQ ID NO 5, SEQ ID NO 7, SEQ ID NO 9 et 
SEQ ID NO 11, codant respectivement pour la CCR d'eucalyprus representee 
par SEQ ID NO 6, la CCR de peuplier representee par SEQ ID NO 8, la CCR 
de fetuque representee par SEQ ID NO 10, et la CCR de tabac representee par 
SEQ ID NO 12, ainsi que la sequence representee par SEQ ID NO 13 codant ' 
pour la proteine representee par SEQ ID NO 14 derivee de la CCR 
d'eucalyprus susmentionnee. 

De meme. sont exclues des sequences nucleotidiques de 1'invention et de 
leur utilisation susmentionnee. les sequences complementajres des sequences 
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~ d ;r; 0 SE , Q 3 'ir^ 0 r ° 7 seq < d - »■ «» ">*>.. 

sequences nuc,eo,idiq "o 1 T" 1 '* ^"<~ de ces 

et sequences derivees ,els que defink • 7 ,den "1"« aux fragments 

^semees par SEQ toTalT^'^'^'™"**" 

complementaires. 3 ou de leu rs sequences 

Son, egaiemen, exCus du eadre de ,a presen.e ,„ve„,io„ . 

SEQ ,D N0 5 SEot NO f*?**"" pa r 
SEQ ,D NO ,3 „ cod " un f Q ' D N ° * SE ° ,D NO 
fences dADN. ^ ^ ^^fT* * - 

■dencques aux fragmen.s e, sequences der.v^e e ™ 
<eaue„ces repress par SEQ , D NO , et SEq Id NO ' "'^ ** 

ARNn^nCoLr 15 ™ 5 C ° nS,i '" S * " UC,te * ite — - des 

- les polypeptides represents nar SFn m . 
SEQ .D NO ,0. SEQ ID NO 12 e, SEQ D NO 4 Q ' D N ° 8 ' 

sequence derivee des poivpep.M 1 ^ ** fragmeM ° U 

puiypeptides susmentionnes dan*; i a m „o. 

fragmen, ou sequence derivee son, .demiques a x 1 ° U " 

derivee, tels definis ci-dessus H„ • frapnems e, sequence 

SEQ , D NO 2 e, SEQ ,D NO 4 ^"'^ P" 

-n, pour ,a Z^el* ^ " * 

A) Obtention de la CCR d'eucalyptus puriflee et de I'ADV , 
pour une CCR d'eucaiyptus. Nc Codant 

reducase from cell suspension cul,u" sT k C ° A: 
Biochem.. 65: 529-536 SOybea " (G?V ™' "*»>• Eur J 

Luderuz T.. Orisebach H 1981 c, 

P-cursors. compare of c,nna m ov, C„A r* r C T'^ " ^ 

" COA redu «ase and cinnamyl alcohol 
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dehydrogenase: NADP dehydrogenase from spruce (Picea abies L.) and 
soybean {Glycine max L.). Eur. J. Biochem., 119: 115-127. 

Sarni F., Grand C, Boudet A.M., 1984 - Purification and properties of 
cinnamoyl: Co A reductase and cinnamyl alcohol dehydrogenase from poplar 
stems (Populus x euramericana). Eur. J. Biochem.. 139: 259-265. 

Le travail decrit ci-apres a contribue a definir un protocole de 
purification original, simple et rapide de la CCR d'eucalyptus. Ce protocole 
est egalement plus efficace que ceux decrits precedemment dans la litterature. 
En effet. il a permis pour la premiere fois. 1'obtention de quantites d'enzyme 
purifiee a homogeneite. suffisantes pour obtenir des sequences peptidiques 
internes et conduire a terme au clonage de l'ADNc correspondant. 

Toutes les etapes de purification de la CCR ont ete realisees a 4°C. 

1 Obfention d'un exrrair brut rie yy^me d eiiralyp p.c 

Le materiel vegetal a ete obtenu par "grattage" dune fraction tissulaire 
enrichie en xyleme de branches d' Eucalyptus gunnii ages de 5 ans. 

300 g de xyleme prealabiement congele dans I 'azote liquide ont ete 
reduits en poudre a I'aide d'un moulin a cafe. Le broyat ainsi obtenu a ete 
homogeneise dans un litre de tampon d 'extraction (100 mM Tris-HCl pH 7 6 
2% PEG 6000, 5 mM DTT, 2% PVPP), filtre sur deux epaisseurs de 
Miracloth, et amene a 30% de la saturation en sulfate d'ammonium. Apres une 
centriftigation de 30 minutes a 15000xg. le culot obtenu est remis en 
suspension dans 60 ml de tampon I [20 mM Tris-HCl pH 7.5. 5 mM DTT 
(dithiothreitol), 5% ethylene glycol]. L'extrait ainsi obtenu est "clarifie" par 
une centrifugation de 15 min a 10 OOOxg, puis dessale par passage sur une 
Sephadex G25 equilibree dans le tampon 1. 

2, Chromatopranhie d 'affinity s ,, r R ed Sr V h» T ^ 

L extrait brut dessale est depose sur une colonne d'affinite "Red 
Sepharose" (1.5 x 19 cm. Pharmacia), equilibree dans le tampon 1. Apres un 
premier rincage de la colonne par 50 ml de tampon 1, les proteines sont eluees 
par un gradient lineaire de Tris de 20 mM a 1.5 M Tris-HCl pH7.5, contenant 
5 mM DTT, 5% ethylene glycol. Le volume total du gradient est de 200 ml et 
le debit de 36 ml/h. les fractions presentam une activite CCR sont regroupees 
et dessalees par passage sur une colonne de Sephadex G25. equilibree dans le 
tampon 1. 
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Les fractions ainsi regroupees et dessalees sent chromatographies sur 
une co.onne d'echange d'anions MonoQ (HR 5/5. Pharmacia). L'etion d 

e^Ha e pH Ct ;" " raPP,iCatl ° n gradi£nt * ™ * ~ 

en Tns-HCI pH 7... contenant 5% d'ethylene glycol et 5 mM DTT F, 

vo «me tota. du gradient est de 50 m. et ,e debit de , ml/ J ^ 
etape precedent. ,es fractions contenant ,'en.yme CCR ^ ve son 
regroupees et dessalees. ma.s dans ce cas ,e tampon 

s~ :rr est un tampon — te 20 - pH — 

~ drominopraphif dVfini.e s„ r "M r m -r i- P n r 

Le group, de fractions CCR ainsi obtenu es. depose sur une colonne 

a r;: , d d 2 A6XL <acl - cambrid8e> u - p^*-- 

avec 30 ml de .ampon 2 con.enan, 8 mM NAD. Ce lavage a pour bu, 
d el lmine r des en2ymes fonc[lomiam sp4cinquemem ^ 

ofaceur. ,e„e que !a ma!a,e deshydrogenase q ui copur.fie avec (a CCR dans 
es capes preceden.es. L'eluuon specific de ,a CCR es, obrenue par 
apphcauon d un gradien, (15 ml) de NADP 0-8 mM dans le tampon ■> L 

fractions contenant la CCR pure et activ. „,„, . 

P ure « ac "ve sont conservees a -80°C apres 
add,.,™ d un stabdisateur (ethylene glycol a la concentration finale de 3%) 

L enzyme purif.ee ainsi obtenue presente une ac.ivite specifique de 451 
nKa„mg de pro.e.ne. en ut.lisan, ,e feruloy! CoA comme substra, Le 
rendemen, obtenu ,36 „g de proteine pure pour 300 g de materiel veseta. de 
depar.) „e re fle,e pas la proportion de CCR ,„ plmta , en cffet da „ s „"„ ^ 
m r e mtner ,e maximum de con.aminan.s a cnaque e,a P e de purir.ca.ion. 

71 1 7 r™ "** f ° rK aCtiV " S CCR -™ P-r 

e,ape su.vame. Le faceur de pur.fica.ion ob.enu par ce pro,ocole es, de 282 



11 Carafferisation Hp ^ rrp, 



les resuha^ d,eUCal> ' PrUS ™ * 38kD comme en temoignent 

es resuitats convergent obtenus pour la tail.e de lenzvme native par 

chromatographic d 'exclusion sur Superose 6 (Ph* m * ■ ' 

i., • • superose b (Pharmacia), et pour la taille de 

w sous-unite monomere sur op\ h'^i~ . • 

sur gel d electrophorese denaturant. Le point 
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isoeiectrique, estime par chromatographic sur MonoP (Pharmacia) est proche 

de 7. 

La recherche du pH et du tampon optimum fait ressortir que la mesure 
de 1'activite CCR telle qu'eile a ete initialement decrite (Luderitz et Grisebach, 
1981). est parfaitement adaptee a ia mesure de Tactivite CCR d'eucalyptus 
(tampon phosphate 100 mM, pH 6.25). 

La purete de la CCR, presente a I'etat d une bande unique sur gel 
d electrophorese monodimensionnelle (SDS PAGE) a ete confirmee par 
i'obtention d'une seule tache ("spot") apres electrophorese bidimensionnelle et 
coloration a Targent. 



HI QbtentiOH de 1'ADNc rodant pour la CCR rt'enralvp t.^ 

Afin de s'affranchir d'un eventuel probleme de contamination residuelle 
non detectable, l'enzyme pure a ete soumise a une electrophorese preparative 
en conditions semi-denaturantes et digeree in situ dans le gel. La digestion a 
ete realisee a Taide d'endolysine C qui coupe specifiquement les proteines 
apres les residus lysine, permettant I'obtention de peptides relativement longs. 
Les peptides resultant de la digestion ont ete separes en phase reverse sur 
HPLC et certains d'entre eux ont ete sequences a l aide d un microsequenceur 
de proteines (Applied Biosy stems 470). Les sequences de ces peptides internes 
figurent ci-dessous: 



peptide 8 (a) Asn-Trp-Tyr-Cys-Tyr-GIy-Lys 

fb) His-Leu-Pro-Val-Pro-X-Pro-Pro-Glu-Asp-Ser-Val-Arg 
X representant tout acide amine 

peptide 10 Thr-Tyr-Ala-Asn-Ser-Val-Gln-Ala-Tyr-Val-His-Val-Lys 

peptide 1 3 Gly-Cys-Asp-Gly-Val-Val-His-Thr-Ala-Ser-Pro-Val-Thr-Asp- Asp 

peptide 17 Leu-Arg-Asp-Leu-Gly-Leu-Glu-Phe-Thr-Pro-Vai-Lys 
peptide 1 8 Gly- Asp-Leu-Met- Asp-Tyr-Gly-Ser-Leu-GIu-GIu-Ala-Ile-Lys 



L'ADNc codant pour la CCR a ete obtenu par criblage a l'aide 
d'oligonucleotides d'une banque d'ADNc construite dans le phage X ZAPII 
fvecteur commercialement disponible, Stratagene) a partir de messagers 
extraits de xyleme d' Eucalyptus gunnii. 600 000 phages ont ete cribles a Taide 
d'un groupe d'oligonucleotides degeneres marques a Textremite 3* au 
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Phosphore 32, a laide dune K ™La. u-ansferase. Les sequences des 
.gonuCeoudes u.iUses pou r ,e criMage on, e,e de temi „ees pa" d 

' T: P~ ,—on -•«^^^" d( ELrt 

effet. cet ac.de amine qui ne oeut erre ™h» senerescence. En 

- -des am.es ^ ,e .7 £ ^ " " ~ " 

— , r , . faiI a rmMm , oli „, Wes , parti -; = 

Les sequences des oligonucleotides u.ilises pour le crib',- de l a h 
de cDNA deucaiyp.s der,vees des acides amines sou, 1". - „ 
sont indiquees ci-apres: ~ ,nosme )- 

pept,de 8 (a) i-^^Aa^I^^ 
" ohgonuclecide 8 AA(A/G)AA(C/T)TGGTA(C/T>TCKC/T,TA(T/C)GGIAA 



peptide 13 
Asp 



uligonucleot.de 13 AA(G/'A)GGITG(C/T)GA(C/T)GGIGTfGT[CA 

Peptide 17 ^-Leu-Arg-Asp-Leu-G.y-Uu^^ 
ohgonucleot.de 17 GAfG/A)TT(C/T)AClCCIGTIAA 

„ 7 tlde ! 8 ^^^^ 

-> ohgonudeoude 18 AA(G/A)GGIGA(C/T)(C/T)T1ATGGA(C/T)TA(C/T)GG 

Les conditions d'hybridation utilisees pour le criblaee sont les su.vantes- 
la prehybridation est effecruee oendanr * 7 h , suivantes. 

uct-iuee pendant 6 a 7 heures dans du 5XSSPE 0 25 V 
poudre de lait ecreme nns^ cnc / ^ ' * 

\o pL i • , ' ° ° 5% SDS ( sodlu ™ dodecyl sulfate) a 42°C 

oi ; T 10 : ***** d3nS CCtte «**°n. en presence des 4 

ohgonucleottdes marques en 3' au ddAT Pa 32 P , pendam „ ^ , 

Au terme de ces 24 heures d'hybridation, les fi.tres sont laves trots fois 
Pendant ,5 minutes dans du 2XSSC< q. 1 % SDS puis miS en contact ec u 
f.lm autoradtographique pendant 24 heures a -80°C. Les phages hybrid.ni 
avec le groupe d 'oligonucleotides ont ete purifies oar 2 rnnrf 
de criblape t* n i» n , • . P ur,t| es par 2 tours supplemental 

d c blage p, aq ue punficat.on"). Une fois purifies, les six clones positifs 
o ete testes avec chacun des o.igonucleotides prts independamment Un 
Phage a reagt positivement avec les 4 o.igonucleotides. i, a ete tratte d 
-mere a exc.ser" ,e plasmide Bluescr.pt recomb.nant en sutvant 1 
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indications du fabricant (Stratagene). La carte de restriction de I' insert (codant 
pour la CCR) contenu dans ce plasmide est schematisee sur la figure 1 . 

IV Caracterisation et identification dp I' ADN'c rie la rrp 

La sequence en acides amines (representee par SEQ ID NO 6) deduite de 
la sequence nucleotidique (representee par SEQ ID NO 5) code pour une 
proteine de 335 acides amines dont le poids moleculaire est de 36.5 kD et le 
point isoelectrique d'environ 5.8. II est important de souligner que toutes les 
sequences peptidiques obtenues a partir de la CCR purifiee sont retrouvees 
dans la sequence peptidique deduite de la sequence nucleotidique de I'ADNc. 

Des recherches d'homologies avec des clones deja existants ont ete 
effectuees en utilisant les programmes BLAST et FASTA dans toutes les 
banques proteiques et nucleiques disponibles. Une homologie significative a 
etc trouvee avec une autre reductase du metabolisme des composes 
phenol iques. la dihydroflavonol reductase (DFR). L'identite est d'environ 
40% et la similarity proche de 20% entre la sequence peptidique deduite de 
I'ADNc de la CCR et les sequences des di verses dihydroflavonol reductase 
repertories dans les banques, ce qui confirme que le clone identifie est 
20 different d'un clone codant pour une DFR. 

V Production de CCR recombinant? active dans F r^tf . 

Pour aller plus loin dans I' identification de I'ADNc de la CCR. la 
25 proteine recombinante a ete produite dans E. Coli et son activite enzymatique 
a ete recherchee. Les details experimentaux de cette approche sont decrits ci- 
apres. 



15 



1- Introduction de I'ADNc dans le vecteur d'expression pT7-7. 

Afin de pouvoir doner I'ADNc dans le vecteur d'expression pT7-7 
(disponible commercialement), sous le controle du promoteur de la 
T7 polymerase, nous avons du introduire un site Ndel a I'ATG de I'ADNc. 
Ceci a ete realise a l'aide d'une Taq polymerase lors d une reaction 
d 'amplification genique par PCR (Polymerase Chain reaction) entre un 
oligonucleotide mute et une amorce commerciale, T7, situe sur Bluescript en 
aval de l'extremite 3' de I'ADNc. Le produit d amplification obtenu est digere 
par Kpnl, ce site est ensuite repare a l'aide du fragment klenow de I'ADN 
polymerase I avant de soumettre le fragment a une digestion par Ndel. puis le 
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fragment obtenu comportant un site Ndel en s' - • - 

. ■ . - . en ^ et une extremite franche en V 

est inseree a 1'aide d une ADM ta i _, cn ~ 

d une ADN T4 hgase dans le vecteur pT7-7 prealablement 
ou vert par Ndel et Smal. ^otement 

U sequence de I'oligonucleotide mute susmemionne est indiquee ci- 



apres 



Les bases soul.gnees et en italiques ont ete modifiees par rapport a la 
sequence initiale permettant la creation d'un site Ndel (CATATG) 
5GGCAATCCC£4TATGCCCGTCGACGC3' 

2. Surexpression de CCR dans E. Coli BL21 

La construction ainsi obtenue est introduite dans la souche E Coli BL21 
rd-sponible commercialement) qui porte sur son chromosome le eene de ,a 
T7 polvrnerase sous controle du promoteur lac UV5, promoteur inductib.e par 
1 IPTG. La culture recombinante est cultivee a 37°C jusqu a obtennon d une 
DO mesuree de , a 600 nm, puis la production de la CCR est indune par 
I ajout d IPTG (0.25% final, dans ,e milieu de cu.ture. Des prelevements sont 
realises a d.fferents temps apres induction et les cellules sont Ivsees selon le 
protocole decnt par Grima-Pettenati et al. (1993). Apres centnfu Sa tion le 
surnageant contenant les proteines solubles, est utilise pour mesurer Vactivite 
CCR et pour visualiser la production de CCR apres electrophone en 
cond.fons denaturantes. On note ,'apparition d'un polypeptide denviron 38 
kD dont I mtensite croit avec le temps post-induction et qui n'existe pas dans 
les temoms negatifs (souche BL21 contenant seulement le vecteur pT7-7 sans 
insert,. De plus, la preuve finale de Tidentite du clone CCR est apporte par .a 
mesure d^une act.v.te CCR (environ 7 nKat/ml de cu.ture apres 3h deduction 
37 c) dans les extraits proteiques provenant des souches BL21 contenant le 
pT7-7 + ADNc CCR. seulement. 

Le vecteur denomme pEUCCR (represent, sur la figure 2). comprenant 
la sequence representee par SEQ ID NO 5 clonee dans le vecteur Bluescript a 
ete depose en culture dans des cellules de E. coli DH5a a la Collection 
Nanonale de Culture de Micro-organismes (CNCM) de 1'Institut Pasteur a 
Pans (France), le 17 mars 1994 sous le n° 1-1405. 
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Figure l: carte de restriction de I'ADNc codant pour la CCR 
d' eucalyptus. 

Figure 2. representation schematique du plasmide pEUCCR contenant la 
sequence representee par SEQ ID NO 5 (et identifiee par CCR dans le 
plasmide pEUCCR). 

"' Figure 3: representation schematique de la construct.on d'un vecteur 

contenant une sequence d'ADN codant pour la CCR d 'eucalyptus selon 
1 invention (ou vecteur CCR sens). 

Figure 4: representation schematique de la construction d'un vecteur 
contenant une sequence d'ADN codant pour un ARN antisens susceptible de 
shybnder avec I ARNm codant pour la CCR d'eucalyptus selon I' invention 
(ou vecteur CCR antisens). 

Concernam I'AON "sonr rr <-, rvant k „ d , m 

20 antisens (ny ^ n c) 

L'ARN ant.sens derive preferentiellement de la sequence contenue dans 
le clone pEUCCR. Cette sequence peut etre obtenue de differentes manieres- 

1) en coupant avec des enzymes de restriction appropriees la sequence 
d'ADN (ADNc) de la CCR contenue dans pEUCCR. 

2) en realisant une amplification eenique (PCR) a l'aide 
^oligonucleotides definis de maniere a synthetiser le fragment d'ADN 
souhaite. 

Le fragment d'ADN ainsi obtenu est clone dans un vecteur depression 
'0 des plantes en aval d'un promoteur et en amont d'un terminateur. Le clonage 
est real.se de telle facon que le fragment d'ADN est insere en orientation 
inverse par rapport au promoteur. Dans ce nouveau vecteur. le brin qui etait 
mitialemem le br i n matrix devient le brin mHam et vice versa. 

Le nouveau vecteur code pour un ARN dont la sequence est 
complements de la sequence de 1'ARN messager deduit de la sequence 
contenue dans pEUCCR. 

Ainsi les 2 ARN sont complements de par leur sequence mais aussi 
de par ieur orientation (5'-3'). 
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Comme source d'ADN pour la transcripuon de I'ARN antisens il est 
pratique d'utiliser un clone d'ADNc tel que celui contenu dans pEUCCR. 

gxemple de clonap fi a m iv» n * (c f. flgure 4) 

L'ADNc de la CCR est obtenu par une double digestion (BamHI et 
Kpnl) a partir du vecteur pEUCCR. Le fragment d'ADN ainsi libere est 
separe physiquement du vecteur de clonage par une electrophorese en eel 
d 'Agarose (Bluescript). 

La partie de gel renfermant ce fragment d'ADN est decoupee et traitee 
de facon a obtenir l'ADN purifie (plusieurs methodes peuvent etre ut.lisees 
dont la "Low melting Agarose", decrite dans Sambrook et al. susmentionne le 
Gene Clean, dont le kit est disponible commercialement). 

Le fragment portani les extremes BamHI et Kpnl est "lieue" avec un 
vecteur depression de plantes prealablement digere par ces memes enzvmes 
cho.s.es de facon a ce que , e cDNA sou insere en orientation inverse par 
rapport au promoteur 35 s . Le brin quj sepa transcrit dans ^ ^ ^ 

ce cas lc brin non codant. 



20 



30 
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Exemnle de donate <=cm < c f. figure 3) 

Dans ce cas, il n'existe pas de sites de restriction "pratiques" pour 
reahser une fusion traductionnelle avec le promoteur 35 s du vecteur 
depression. De nouveaux sites plus commodes ont ete inseres a I'aide de la 
techn.que d'amplification genique (PCR). Deux olieonucleotides ont ete 
det.ms en 5" et 3' de 1'ADNc auxquels ont ete ajoutees les sequences des sues 
reconnus par Kpnl et BamHI (NB, ce sont les memes sites qui ont ete utilises 
pour le clonage antisens susmentionne, mais posit.onnes differemment par 
rapport a 1 'orientation 5 '-3'). 

L'ampliF,cation genique conduit a 1'obtention d'un fragment contenant la 
totalue de la sequence codante du cDNA flanquee de 2 sites de restriction La 
suite de la procedure est identique a celle decrite pour la construction antisens. 

Mais, dans ce cas. on a realise une fusion du promoteur en phase avec 
1 ATG de la CCR qui doit cond^ire a une surexpression de I'ARN messager et 
done de la proteine CCR. 

Les exemples de clonage des sequences sens et antisens decrits ci-dessus 
dans le cas de la CCR d eucalyptus. sont egalement applicables dans le cas de 

la CCR de luzerne et de celie de mais. 
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B) Obtention de l'ADNc codant pour la CCR de luzerne {Medicago 
truncatula). 

Caracteristiques d e la banque d'ADNc : 
5 La banque utilisee a ete construite a partir d'ARN totaux extraits de 

racines de Medicago truncatula^ dans le vecteur A.ZAPH (kit "ZAP-cDNA 
synthesis" de Stratagene). 

Criblage de la banque d'ADNc • 
Sonde : 

10 Le criblage de la banque de luzerne a ete effectue a l'aide de l ADNc 

codant pour la CCR d'eucalyptus. Un fragment de 800 bp (Xho-Xho) de 
pEUCCR marque par la technique d'amorcage aleatoire a servi de sonde. 

Etalement de la banque et empreintes sur filtre de nitrocellulose : 
300 000 clones ont ete etales puis transferes sur filtre de nitrocellulose 
i> (Schleicher & Schuell). Pour cela, les filtres ont ete places 5 mn sur les boites 
de culture puis immerges successivement dans les solutions suivantes : 

1 .5M NaCl/0, 5M NaOH 5 mn 

L5M NaC!/0, 5M Tris pH 8 5 mn 

2 ° 3x SSC 2 mn 

cuisson 2 heures a 80°C. 



Prehybridation-hybridation : 

Les filtres ont ete prehybrides pendant 12 heures, puis hybrides 
pendant 24 heures a 37 °C dans le milieu suivant : 

Milieu de prehybridation et d'hybridation : 
Formamide 20% 
Dextran 10% 
NaCI 1M 

ADN sperme de saumon (1 mg/ml) 
0,2% polyvinyl-pyrrolidone 
0.2% BSA 
0,2% ficoll 

0,05M Tris-HCl pH 7.5 
0,1 % sodium pyrophosphate 
1% SDS. 



Hi 
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Apres hybridation, les filtres ont ete laves 2x 10 mn a temperature 
iTuZn d3nS ^ ^ SSC " 1% SDS - PU,S 2X 30 mn * 55 ° C d3nS 13 

Apres exposition autoradiographique des filtres, 15 plaoes de Ivse 
positives ont ete identifies. Ces plages de lyse ont ete purifies p^ar 2 cycles 
supplemental de criblage. dans .es conditions d'hybridation decntes ci- 

dessus. Cl 

Excision in vivo : 

A partir des clones positifs, le plasmide Bluescnpt du phage / a ete 
exc.se se.on le protocole decision in vivo du "ZAP-cDNA Synthesis kit'" 
L'ADNc CCR de luzerne : 

L'ADNc codant pour la CCR de luzerne. d une taille de 1404 pbs est 
msere entre les sites EcoRl (cote 5') et Xho (cote 3 ) du vecteur Bluescript II 
est constirue des parties suivantes : 

- une partie 5' transcrite non traduite de 167 pbs. 

- une region de 1028 pbs qui code pour une prote.ne de 342 acides 
amines, 

- une partie 3' transcrite non traduite de 209 pbs. 

L'ADNc obtenu est represente par SEQ ID NO 1. et la sequence en 
acides amines deduite de cet ADNc est represente par SEQ ID NO 2. 

C) Obtention de l'ADNc codant pour la CCR de mais. 

Caracteristinnes de la ban que d'ApN^ 

La banque utilisee a ete constru.te a partir d'ARN totaux extraits de 
racines de mais (variete AMO 406) carence en fer. dans le vecteur /.ZAP (kit 
ZAP-cDNA synthesis" de Stratagene). 
Criblage de la hangup ^ APNr ; 
Sonde : 

Le criblage de la banque de mais a ete effectue a l'aide de l'ADNc 
CCR d'eucalyprus. Un fragment de 800 bp (Xho-Xho) de pEUCCR marque 
par la technique d'amorcage aleatoire a servi de sonde. 

Etalement de la banque et empreintes sur filtre de nitrocellulose : 
500 000 clones ont ete etales puis transfers sur filtre de nitrocellulose 
(Schleicher & Schuell). Pour cela, les filtres ont ete places 5 mn sur les boites 
de culture puis immerges successivement dans les solutions suivantes 
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L5M NaCl/O, 5M NaOH 
1,5M NaCI/O, 5M Tris pH 8 
3x SSC 



2 mn 



5 mn 



5 mn 



cuisson 2 heures a 80°C. 
Prehybridation-hybridation : 

Les filtres ont ete prehybrides pendant 12 heures. puis hybrides 
pendant 24 heures a 55 °C dans le milieu suivant : 



Milieu de prehybridation et d 'hybridation : 

3x SSC 

0,5% SDS 

0. 1 % lait en poudre 

ADN sperme de saumon (1 mg/ml). 



Apres hybridation, les filtres ont ete laves 2x 10 mn a temperature 
ambiante dans du 3x SSC-0.5% SDS, puis 2x 45 mn a 60°C dans la meme 



Apres exposition autoradiographique des filtres. 20 plages de lyse 
positives ont ete identifies. Ces plages de lyse ont ete purifiees par 3 cycles 
supplementaires de criblage, dans les conditions d' hybridation decrites ci- 
dessus. 

Excision in vivo : 

A partir des clones positifs, le plasmide Bluescript du phage k a ete 
excise selon le protocole d'excision in vivo du "ZAP-cDNA Synthesis kit". 

L ADNc obtenu est represent par SEQ ID NO 3. et la sequence en 
acides amines deduite de cet ADNc est represente par SEQ ID NO 4. 
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LISTE DE SEQUENCES 

(I) INFORMATION GENERATE: 
( i ) DEPOSANT : 

(A, NOM: CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

(B) RUE: 3, rue Mxchel-Ange 

fC> VILLE: PARIS 75016 

{ E ) PAYS : FRANCE 

<F) CODE POSTAL: F- 75016 

(ii) 7ITRE DE L- INVENTION ; SEQUENCES D ' ADN CODANT POUR LA CINNAMOYL 
CoA REDUCTASE , ET SES APPLICATIONS DANS LE 
DOKAINE DE LA REGULATION DU TAUX DE LIGNINE CHEZ LES 
PLANT ES 

(iii) NOMBRE DE SEQUENCES: 14 

(iv) FORME LIS IBLE PAR ORDINATEUR : 

(A) TYPE DE SUPPORT: Floppy disk 

(3) ORDINATEUR: IBM PC compatible 

<C) SYSTEME D ' EXPLOITATION: PC- DOS/MS -DOS 

(D) LOGICIEL : PaCentln RpIp^cd tn n 

eilLin Ke lease #1.0, Version #1.25 COEB) 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1568 paires de bases 
<B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 2 78 . .1306 

(Xij DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

CATGATTACG CCAAGCTCGA AATTAACCCT CACTAAAGGG AACAAAAGCT GG AG CTC C AC 6 0 

CGCGGTGGCG GCCGCTCTAG AACTAGTGGA TCCCCCGGGC TGCAGGAATT CGGCACGAGG 

GGATAGAGAA GAAAGGTGGT CATATTTCCC ACTTATTATT ACAAAGTAAC GTCACACCAA 18 Z 
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CTTTATCACC ACCTTTCTTC TCTATCCCAT TCATTCTCAT TCATTCATTC ACCTCACCTC 

ACCTCACCTC ACCTCCCTTT ACAAGAAGAA GGAATAT ATG CCT GCC GCT ACC GCC 

Met Pro Ala Ala Thr Ala 
1 5 



GCC GCC GCC GCC GAA TCT TCC TCA GTT TCC GGC GAA ACC ATA TGT GTC 
Ala Ala Ala Ala Glu Ser Ser Ser Val Ser Gly Glu Thr lie Cys Val 
10 15 2C 



GGG GCC GGT GGC CTC ATC GCT TCT TGG ATG GTT AAG CTC CTC TTG 

Thr Gly Ala Gly Gly Leu He Ala Ser Trp Met Val Lys Leu Leu Leu 
25 30 35 

GAG AAA GGC TAT ACC GTT CGA GGA ACC TTG CGA AAC CCA GAT GAT CCA - 

Glu Lys Gly Tyr Thr Val Arg Gly Thr Leu Arg Asn Pro Asd Asp Pro 
40 45 50 



240 



343 



39; 



439 



AAT GGG CAC TTG AAA AAG TTG GAA GGA GCA AAA GAA AGG CTA ACT 487 
Lys Asn Gly His Leu Lys Lys Leu Glu Gly Ala Lys Glu Arg Leu Thr 
55 60 6S 7C 

TTG GTC AAA GTT GAT CTC CTT GAT CTT AAC TCC GTT AAA GAA GCT GTT 53 5 

Leu Val Lys Val Asp Leu Leu Asp Leu Asn Ser Val Lys Glu Ala Val 
75 80 85 

AAT GGA TGT CAT GGT GTC TTT CAC ACT GCT TCT CCC GTT ACA GAT AAC 53 3 

Asn Gly Cys His Gly Val Phe His Thr Ala Ser Pro Val Thr Asp Asn 
90 $5 100 

CCC GAG GAA ATG GTG GAG CCA GCA GTG AAT GGA GCA AAG AAT GTG ATC 631 
Pro Glu Glu Met Val Glu Pro Ala Val Asn Gly Ala Lys Asn Val He 
105 110 115 

ATA GCT GGT GCA GAA GCA AAA GTG AGG CGC GTG GTT TTC ACA TCA TCA 67 9 

He Ala Gly Ala Glu Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser 
120 125 130 

ATT GGT GCA GTC TAT ATG GAC CCC AAT AGG AGT GTT GAT GTA GAG GTT 72 7 

He Gly Ala Val Tyr. Met Asp Pro Asn Arg Ser Val Asp Val Glu Val 
135 1^0 i 4 5 150 

GAT GAG TCT TGC TGG AGT GAT TTG GAG TTT TGC AAG AAA ACC AAG AAT 7 75 

Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Lys Thr Lys Asn 
155 160 165 

TGG TAT TGC TAT GGG AAA GCA GTG GCA GAA GCA GCA GCA TGG GAT GTA 8 23 

Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Ala Ala Ala Trp Asp Val 
170 175 180 

GCA AAA GAG AAA GGT GTG GAT TTG GTT GTA GTG AAT CCA GTT TTG GTT 8 71 

Ala Lys Glu Lys Gly Val Asp Leu Val Val Val Asn Pro Val Leu Val 
185 190 195 

CTT GGA CCA TTG CTA CAA CCT ACA ATC AAT GCA AGC ACA ATT CAC ATA 919 
Leu Gly Pro Leu Leu Gin Pro Thr He Asn Ala Ser Thr lie His He 
200 205 210 
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GAG AAA CCT TCT GCT TCT GGT AGA TAG TTA TGT GCT GAA ACT TCA CTT 

ulu Lys ?ro Ala ser Giy ^ in Leu cys Ala Glu ? " 



260 



CAT CGT GGG GAG CTT GTT GAA ATT CTT GCT AAG TAT TTr r~r~r GA ~ Tflr 

H1S Arg til Glu Leu Val Glu Ile Leu Ala ^ Ph ; ;:; ^ 



270 2?c 



£T ^ ^ ^ CCT CGA GTG AAA CCA 

PFU "J ?r ° L - /S CyS SSr AS P Glu ^ Asn Pro Arg Val Lvs Pro 

*i C U ~) Q c 



285 29Q 

CAT ATC TTC TCA AAT AAA. AAA CTG AAG GAT TTG GGA r- > -r- ^ 

Kxs lie Phe ser Asn Lys Lys Leu Lys Asp Le ! ^ ^ ^ £ £ 

^ 3 0 0 t at 

305 310 

p"' vTl sel G f T A GTT ^ AGC CTA CAA ^AC CAA 

P-o Val Ser .lu Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin Asp Gin 

315 320 325 

Til S C T CCA AAC *** GAA GAT TCT CTA GCA GTC AAA TCC 

Gly His Leu Ser He Pro Asn Lys Glu Asp Ser Leu Ala Val Lvs Ser 
330 335 



340 



TAAACCAACC ATCCTTTGTT AACAAGTTCA ATTCAGGGCC AAAAAGAATC ATCTTTTAGC 

TACCTGCGAG GCTTTAGGCT CTAGCAATTT GATACTATAA ATGACCGTAA TTGGATGGAT 

AGTTG T AAG A AAG T ATC ATG CTAGAATTTA CTATTTGTCT TTATGTTTGA AAAATAAGCC 

CATTATATTA AAAAAAAAAA AAAAAAAAAA AACTCGAGGG GGGGCCCGGT ACCCAATTCG 

CCCTATAGTG AGTCGTATTA CAATT 

(2) INFORMATION POUR LA SEQ ID NO : 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 342 acides amines 
(B> TYPE: acide amine 
( D) CONFIGURATION : 1 ineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi> DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 2: 
Met Pro Ala Ala Thr Ala Ala Ala Ala Ala Glu Ser Ser Ser Val Ser 



967 



CTA AAA TAC CTA ACT GGT TCA GCT AAG ACC TAT GCA AAT GC, ACA CAA 
Leu Lys Tyr Le u Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ala r hr O^n 

220 22 5 230 

GCT TAT GTT CAT GTT AGG GAT GTT GCA TTA GCT CAr ATA — T GT~ t,t 
Axa Tyr Val His Val Arg Asp Val A!a Leu Ala His" lie lZ ^ ™! 

zqu 245 



1063 
1111 
1159 

12C7 

1255 

1303 

1363 
1423 
1483 
1543 
1568 



10 



15 



NSOOCID: <WO 9712982A1J_> 



WO 97/1 2982 PCT/FR96/01 544 

- 37 - 

Giy Giu Thr He Cys Val Thr Gly Ala Gly Gly Leu He Ala Ser Trp 
20 25 30 

Met Val Lys Leu Leu Leu Glu Lys Gly Tyr Thr Val Arg Gly Thr Leu 
35 40 45 

Arg Asn Pro Asp Asp Pro Lys Asn Gly His Leu Lys Lys Leu Glu Gly 
50 55 60 

Ala Lys Glu Arg Leu Thr Leu Val Lys Val Asp Leu Leu Asp Leu Asn 
5 5 . 70 75 80 

Ser Val Lys Glu Ala Val Asn Gly Cys His Gly Val Phe His Thr Ala 
35 90 95 

Ser Pro Val Thr Asp Asn Pro Glu Glu Met Val Glu Pre Ala Val Asn 
100 105 HO 

Gly Ala Lys Asn Val He lie Ala Gly Ala Glu Ala Lys Val Arg Arg 
115 12G 125 

Val Val Phe Thr Ser Ser lie Gly Ala Val Tyr Met Asp Pro Asn Arg 
130 135 140 

Ser Val Asp Val Glu Val Asp Glu Ser Cys Trp Ser Asp Leu Giu Phe 
1^5 150 155 " 160 

Cys Lys Lys Thr Lys Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu 
165 170 175 

Ala Ala Ala Trp Asp Val Ala Lys Glu Lys Gly Val Asp Leu Val Val 
180 185 190 

Val Asn Pro Val Leu Val Leu Gly Pro Leu Leu Gin Pro Thr He Asn 
195 200 205 

Ala Ser Thr He His He Leu Lys Tyr Leu Thr Gly Ser Ala Lys Thr 
210 215 220 



Tyr Ala Asn Ala Thr Gin Ala Tyr Val His Val Arg Asp Val Ala Leu 
5 230 235 240 



Ala His He Leu Val Tyr Glu Lys Pro Ser Ala Ser Gly Arg Tyr Leu 
245 250 255 

Cys Ala Glu Thr Ser Leu His Arg Gly Glu Leu Val Glu He Leu Ala 

260 265 270 

Lys Tyr Phe Pro Glu Tyr Pro He Pro Thr Lys Cys Ser Asp Glu Lys 

275 280 285 



Asn Pro Arg Val Lys Pro His He Phe Ser Asn Lys Lys Leu Lys Asp 
290 295 300 



Leu Gly Leu Glu Phe Thr Pro Val Ser Glu Cys Leu Tyr Glu Thr Val 
305 310 315 320 
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Ser Leu Ala val Lys Ser " 5 
340 

i2) INFOR WATION POUR LA SEQ 1D NO ; 3. 

<i: ' ^fVoM 13 " 0 ^ 5 ° E « SEQUENCE. 
« T/PE: aciae nucleiqu= 
r "° MBRE DE BR INS : d0U b le 
>D) CONFIGURATION .- lineair^ 

; ' U! TYPE DE MOLECULE - ADNc no, * 

ajjnc pour ARNm 

!1Xi CA ^CTERT STIQUE ADDITIONELLE • 
(A) NOM/CLE : CDS ^NELLE . 

<B) EMPLACEMENT: 195. . i310 

° ES — - DE LA SEQUENCE : SEQ ID N0 • 3 - 
GTTCCCATGA TTACGCCAAG CTCGAAATTA ACCCTCACTA AAGT 

Tr~™ AAGGGAACAA AAGCTGGAG^ 

::: tgc ™ t ~ — — „ GC ; 
rr: r™ ~ ~ — ~ 

G ' CGTCGl c ^GG ATG ACC GTC GTC r-o 

M " ~ - " 5 s ™ - 2 E - S 

GCC GGC GCC Cr^ r-r-r- ~ 

«■ «. £ s s s s s ^ ™ r° gcg «° « « 

15 20 1 Pr ° Aia G1 V Asn Gly 

25 

CAG ACC GTG TGC GTC ACC Grr ^ 

- - ~ c, w Thr s s s s ~ s s ~ ~ ™ 

S K 2 SS E S £ ~ Tyr £ S r ~ - ™ » 

50 7 hr V ^ L ^ s Thr val Arg 

- s s P c s e » c s ~ - « „ CTG GSC G0C g ;° 

65 ^ Ar 9 A.a Leu Asp Gly Ala 

GCC GAG CGG CTG ATC CTC Trr ?S 

- «- - - - ^ £ £ s £ 2 S £ 1- « S 
S - i S S S S5 £ S 25 s S ^ ~ r 

100 s inr Ala Ser 



6C 
120 
18C 
230 

27? 
326 
374 



47C 



518 



>ClO <WO 9712982A1J_> 



WO 97/12982 PCT/FR96/0I544 

- 39 - 



CC GTC ACC GAC GAC CCG GAG CAA ATG GTG GAG CCG GCG GTG CGC GGf~ 
Pro Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val Arq Glv 
110 H5 120 ' 

ACC GAG TAC GTG ATC AAC GCG GCG GCG GAG GCC GGC ACG GTG CGG CGG 
Thr Glu Tyr Val lie Asn Ala Ala Ala Glu Ala Gly Thr Val Arq Arq 
125 13C 135 - 14u 

GTG GTG TTC ACG TCG TCC ATC GGC GCC GTG ACC ATG GAC CCC AAG CG^ 
■-ax Val Phe Thr Ser Ser He Gly Ala Val Thr Met Asp Pre Lys Arg 



145 150 



I 3! 



GGG CCC GAC GTC GTG GTC GAC GAG TCG TGC TGG AGC GAC CTC GA-- TTC 
Gly Pro Asp Val Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe 
160 165 170 

TGC GAG AAA ACC AGS AAC TGG TAC TGC TAC GGC AAG GCG GTG GCG GAG 
Cys Glu Lys Thr Arg Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu 
175 180 135 

CAG GCG GCG TGG GAG GCG GCC CGG CGG CGG GGC GTG GAC CTG GTG GTG 
Gin Ala Ala Trp Glu Ala Ala Arg Arg Arg Glv Val Asp Leu Val Val 
150 195 " 20C 



GTG AA.C CCC GTG CTG GTG GTG GGC CCC CTG CTG CAG GCG ACG GTG AAC 
Val Asn Pro Val Leu Val Val Gly Pro Leu Leu Gin Ala Thr Val Asn 

220 



205 210 21 



GCC AGC ATC GCG CAC ATC CTC AAG TAC CTG GAC GGC TCG GCC CGC ACC 
Mia Ser He Ala His He Leu Lys Tyr Leu Asp Gly Ser Ala Arg Thr 
225 230 235 

TTC GCC AAC GCC GTG CAG GCG TAC GTG GAC GTG CGC GAC GTG GC^ GAC 
Pne Ala Asn Ala Val Gin Ala Tyr Val Asp Val Arg Asd Val Ala Asp 
240 245 250 

GCG CAC CTC CGC GTC TTC GAG AGC CCC CGC GCG TCC GGC CGC CAC CTC 
Ala H 1S Leu Arg Val Phe Glu Ser Pro Arg Ala Ser Glv Arg His Leu 
255 260 265 

TGC GCC GAG CGC GTC CTC CAC CGC GAG GAC GTC GTC CGC ATC CTC GCC 
Cys Ala Glu Arg Val Leu His Arg Glu Asp Val Val Arg He Leu Ala 
270 275 28Q 

AAG CTC TTC CCC GAG TAC CCC GTC CCA GCC AGG TGC TCC GAC GAG GTG 
Lys Leu Phe Pro Glu Tyr Pro Val Pre Ala Arg Cys Ser Asp Glu Val 
285 290 295 300 

AAT CCG CGG AAG CAG CCG TAC AAG TTC TCC AAC CAG AAG CTC CGG GAC 
Asn Pro Arg Lys Gin Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp 
305 310 315 

CTG GGG CTG CAG TTC CGG CCG GTC AGC CAG TCG CTT TAC GAC ACG GTG 
Leu Gly Leu Gin Phe Arg Pro Val Ser Gin Ser Leu Tvr Asd Thr Val 
320 325 ' 3 3o 



566 



614 



66: 



'10 



758 



806 



854 



90: 



950 



998 



1046 



1094 



1142 



1190 
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-s Z. G^n J0° G T CTG ' C4?G GTG CTC GAG CGG ACG 

Leu Gin Glu Lys Gly His Leu Pro Val Leu Gly Glu Arg Thr 

340 345 



? h CG s z ™ r s c ccc gcg gcc gag atg °* 

350 P y ASP Ala Pr ° Ala Ala G1 " Met Gin Gin 



355 360 



Z ™ I" S ^ HI S TGAGAGGGCG XG««CG« 



365 37C 



AGCAATGTTC ATACTGCTGC CCTGCACCTG CACCTTCCCC TGCTGTGTAA ACAGGCCTGT 
GTTTGTTCTG GCTGATAGTG ATGTACCCTA AGACTTGTAA CGTCATGTTC GTTCTTGTGA 
ACTATAGCGA G TG AATAAAA TTGGTTAATG TTGGATAATT CCAAAAAAAA AAAAAAAAAA 
CTCGAGGGGG GGCCCGGTAC CCAATTCGCC CTATAGTGA 

i2) INFORMATION POUR LA SEQ ID NO: 4 : 

(ii CARACTERISTIQUES DE LA SEQUENCE 
(A) LONGUEUR: 3 71 acides amines 
(B! TYPE : acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : proteins 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 4 : 
Met Thr val Val Asp Ala Val Val Ser Ser Thr Asp Ala Gl y Ala p ro 

io 1S 

Ala Ala Ala Ala Ala Pro Val Pro Ala Gly Asn Glv Gin Thr Va", Cvs 

25 30 " ' 

Val Thr Gly Ala Ala Gly Tyr He Ala Ser Trp Leu Val Lys Leu Leu 

40 45 

Leu Glu Lys Gly Tyr Thr Val Lys Gly Thr Val Arg Asn Pro Asp Asp 

55 60 
Pro Lys Asn Ala His Leu Arg Ala Leu Asp cly Ala Ala Glu Arg Leu 



70 ,«. 

75 80 



He Leu Cys Lys Ala Asp Leu Leu Asp Tyr Asp Ala He Cys Arg Ala 
val Gin Gly Cys Gin Gly Val Phe His Thr Ala Ser Pro Val Thr Asp 



105 



110 

Asp Pro Glu Gin Met Val Glu Pro Ala Val Arg Gly Thr Glu Tyr Val 

120 125 
Ha Asn Ala Ala Ala Glu Ala Gly Thr Val Arg Arg Val Val Phe Thr 



1238 



1266 

1337 

1397 
1457 
1517 

1556 



135 140 



NSOOCfD: <WO 9712982A1J_> 
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41 



^er ber lie Gly Ala Val Thr Met Asp Pro Lys Arg Gly Pro Asp Vai 
145 150 155 160 

Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Glu Lys Thr 
165 170 175 

Arg Asr: Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Gin Ala Ala Trp 
180 185 190 

Glu Ala Ala Arg Arg Arg Gly Val Asp Leu Val Val Val Asn Pro Val 
195 200 205 

Leu Val Val Gly Pro Leu Leu Gin Ala Thr Val Asn Ala Ser lie Ala 

210 215 220 

His lie Leu Lys Tyr Leu Asp Gly Ser Ala Arg Thr Phe Ala Asn Ala 
225 230 235 240 

Val Gin Ala Tyr Val Asp Val Arg Asp Val Ala Asp Ala His Leu Arg 
245 250 255 

Vai Phe Giu Ser Pre Arg Ala Ser Gly Arg His Leu Cys Ala Glu Arg 
2 60 265 27 0 

Vai Leu His Arg Glu Asp Vai Val Arg He Leu Ala Lys Leu Phe Pro 
275 280 285 

Glu Tyr Pro Val Pro Ala Arg Cys Ser Asp Glu Val Asn Pro Arg Lys 
290 295 300 

Gin Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Leu Gin 
305 310 315 320 

Phe Arg Pro Val Ser Gin Ser Leu Tyr Asp Thr Val Lys Asn Leu Gin 
325 330 335 

Glu Lys Gly His Leu Pro Val Leu Gly Glu Arg Thr Thr Thr Glu Ala 
340 345 35 0 

Ala Asp Lys Asp Ala Pro Ala Ala Glu Met Gin Gin Gly Gly He Ala 
355 360 365 



lie Arg Ala 
370 



INFORMATION POUR LA SEQ ID NO : 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1297 paires de bases 

(B) TYPE : acide nucleique 
<C) NOMBRE DE BRIMS: double 
{ D ) CONFIGURATION: lineaire 



WO 97/12982 

- 42 - 

fii) TYPE DE MOLECULE : ADNc pour ARNm 

fix) CARACTERISTIQUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
(3) EMPLACEMENT: 136. .1140 
CO) DESCRIPTION DE LA SEQUENCE : SEQ ID K0 : E: 

CGGCCGGGAC GACCCGTTCC TCTTCTTCCG GGTCACCG- A~ A "~ 

^----^ - GTTAC ACAACATCTC 

CGGCTAAAAA AAAAAGGAAA AAAAGCGCAA CCTr C A-"T- ~ T ~~ r~~~ 

GCCGGCAATC CCACC ATG CCC GTC G^r G .~,~ CT ~ , „ 

- ^- CTv. U GT TCC GGC CAG ACC 

Met Pro Vai A sp Ala Leu Pre G '- ,~ - ■ ~- ^ 

J - ■ ~- 1 '->->' Gin Thr 

5 

GTC TGC GTC ACC GGC GCC GGC GGG TTC ATC G~C TCP ~rr 

Val r VB ; ~ lGG ATT GTC AAG 

15 20 25 

CTT CTC CTC GAG CGA GGC TAC ACC PT~ rv-r 

ia^ ACC GTu CGA GGA ACC GTC AGG AAC CCA 

Leu Leu Leu Giu A-< 

- - - ■• -i~ vaj. ara giv th-v- </,i * . y rQ 



PCT/FR96/0I544 



Gly T yr Thr Val Arg Gly Thr Val Arg Asn Px 



30 35 

4 0 



12 0 



«C GAC CC= AAG AAT GGT CAT CTG ACA GAT CTG GAA GGA GCC «, GAG 

«p ».P *o .ys as„ 01y „ u Leu Arg Asp Leu Mu Qiy ^ s ^ - 

33 60 

AGG CTG ACG CTG TAC AAG GGT GAT CTG ATG c*r -r*r> „ 

ATG GAC TAC GGG AGC TTG GAA to 
Arg Leu Thr Leu Tvr Lvs n v ^ • 363 
Tyr Lys Gly Asp ,eu Met Asp Tyr Gly Ser Leu Glu 

GAA GCC ATC AAG GGG TGC GAC GGC GTC GTC CAC ACC GCC TCT CCG GTC 

ACC GAC GAT CCT GAG CAA ATG GTG GAG CCA GCC GTG ATC GGG ACG AAA 

105 
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AAT GTG ATC GTC GCA GCG GCG GAG GCC AAG GTC CGG CGG GTT GTG TTC 50" 

Asn val lie Val Ala Ala Ala Glu Ala Lys Val Arg Arg Val Val Phe 
110 H5 i20 



555 



602 



ACC TCC TCC ATC GGT GCA GTC ACC ATG GAC CCC AAC CGG GCA GAC GTT 
Thr Ser Ser He Gly Ala Val Thr Met Asp Pro Asn Arg Ala Asp Val 
" 5 130 135 140 

GTG GTG GAC GAG TCT TGT TGG AGC GAC CTC GAA TTT TGC AAG AGC ACT 
Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Ser Thr 
145 150 155 

G AAC TGG TAT TGC TAC GGC AAG GCA GTG GCG GAG AAG GCC GCT TGG 651 
"sn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Lys Ala Ala Trp 
16 ? 165 17C 



699 



14' 



CCA GAG GGC AAG GAG AGA GGG GTT GAC CTC GTG GTG ATT AAC CCT GTG 
Pro Glu Gly Lys Glu Arg Gly Val Asp Leu Val Val lie Asn Pro Val 
175 18C 185 

CTC GTG CTT GGA CCG CTC CTT CAG TCG ACG ATC AAT GCG AGC ATC ATC 
Leu Val Leu Gly Pro Leu Leu Gin Ser Thr He Asn Ala Ser He He 
190 195 20Q 

CAC ATC CTC AAG TAC TTG ACT GGC TCA GCC AAG ACC TAC GCC AAC TCG 7 95 

His He Leu Lys Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser 
205 21 ° 215 220 



843 



GTC CAG GCG TAC GTG CAC GTC AAG GAC GTC GCG CTT GCC CAC GTC CTT 
Val Gin Ala Tyr Val His Val Lys Asp Val Ala Leu Ala His Val Leu 
225 230 235 

GTC TTG GAG ACC CCA TCC GCC TCA GGC CGC TAT TTG TGC GCC GAG AGC 8 91 

Val Leu Glu Thr Pro Ser Ala Ser Gly Arg Tyr Leu Cys Ala Glu Ser 
240 245 250 

GTC CTC CAC CGT GGC GAT GTG GTG GAA ATC CTT GCC AAG TTC TTC CCT 93 9 

Val Leu His Arg Gly Asp Val Val Glu He Leu Ala Lys Phe Phe Pre 
255 260 265 



TTC ACC CCG GTC 

Phe Thr Pro Val Lvs Gl.n Cys Leu Tvr Glu Thr Val ., 



AAG CAG TGC CTG TAC GAA ACT GTC AAG AGC TTG CAG 

vs Ser Leu Gin 



305 

CAG AAA GGC CAC CTA CCA GTC CCC TCC CCG CCG GAA GAT TCC GTG , G t 
Lys oiy His Uu Pro Val Pro Ser Pro Pro ciu ,so S . r Val ^ 

" 330 

ATT CAG GGA TGATCTTAGA TCCATCACGG TGCGCATTTG TAATCCGGAG 

He Gin Gly 

335 



ACCCTGAGTT CTGCATTGGA ATGGAAGTTG TCAATTGTTC CAAAAAAAAA AAAAAAA 

(2 1 INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 35 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE: proteine 
_<*i, DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 6: 



93^ 
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CAG TAT AAT GTA CCG ACC AAG TGC TCT GAT GAG GTG AAC CCA AGA OW 

270 

AAA CCA TAC AAG TTC TCC AAC CAG AAG CTG AGA GAC TTG GGG CTC GA~ 
L/s Pro Tyr Lys Phe Ser Asn Gin L-s Leu a™ «v , 

' S Leu Ar 9 As P Leu Gly Leu Glu 

O -> n Q r* 

" ' 295 

j v 0 



103! 



1083 



118 0 



AAATGAGAGA AACATGTGGG AATTTGTTTG TACTTTTCT. RPT „ 

IACTTTTCTA AGTCAAACCT GGAGATACCA 124 0 



1297 
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Gly Ala Gly Gly Phe He Ala Ser Trp He Val Lys Leu Leu Leu Glu 
20 25 30 

Arg Gly Tyr Thr Val Arg Gly Thr Val Arg Asn Pro Asp Asp Pro Lys 
35 40 45 

Asn Gly His Leu Arg Asp Leu Glu Gly Ala Ser Glu Arg Leu Thr Leu 

50 55 so 

Tyr Lys Gly Asp Leu Met Asp Tyr Gly Ser Leu Glu Glu Ala He Lys 
65 70 75 80 

Gly Cys Asp Gly Val Val His Thr Ala Ser Pre Val Thr Asp Asp Pro 
85 90 95 

Glu Gin Met Val Glu Pro Ala Val He Gly Thr Lys Asn Val He Val 
100 io5 110 

Ala Ala Ala Glu Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser He 
115 120 125 

Gly Ala Val Thr Met Asp Pro Asn Arg Ala Asp Val Val Val Asp Glu 
130 135 140 

Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Ser Thr Lys Asn Trp Tyr 
145 "0 155 160 

Cys Tyr Gly Lys Ala Val Ala Glu Lys Ala Ala Trp Pro Glu Gly Lys 
1^5 170 175 

Glu Arg Gly Val Asp Leu Val Val He Asn Pro Val Leu Val Leu Gly 
180 185 19Q 

Pro Leu Leu Gin Ser Thr He Asn Ala Ser He He His He Leu Lys'' 
195 200 205 

Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser Val Gin Ala Tyr 
210 215 220 



WO 97/12982 

PCT/FR96/01544 

-46 

V-l Hi, v.l , yS 6sp val „. Ma wi v ^ l ^ ^ 

290 v - 

2 5 5 

3C0 

LVS Cln cys Leu Tyr Glu xhr Val Lys ^ ^ ^ ^ ^ ^ ^ 

310 

315 

^ 3 2 0 



325 



330 

-i3 : 



(2) INFORMATION POUR LA SEQ ID NO : 7 : 

ii) CARACTERISTIQUSS DE LA SEQUENCE: 

(Ai LONGUEUF. : 1376 p ai res de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE: ADNc pour ARNm 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 99.. 1112 

<"> DESCRIPTION DE LA SEQUENCE : SEQ ID NO, 7: 
^CACAC CTCCTCTCTT CTTTGTCTCT CTCTGTTCTC CACTTTCCCA CTCACCAAAC 
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WO 97/12982 PCT/FR96/01544 

- 47 - 

TCGTATGCAT ATAATTACAT TTATCTAAAT ATAACAAC ATG CCT GTT GAT GCT 113 

Met Pro Val Asp Ala 



TCA TCA CTT TCA GGC CAA GGC CAA ACT ATC TGT GTC ACC GGG GGT GGT 161 
Ser Ser Leu Ser Gly Gin Gly Gin Thr lie Cys Val Thr Gly Gly Gly 
10 15 2 C 

GGT TTC ATT GCT TCT TGG ATG GTT AAA CTT CTT TTA GAT AAA GGT TAC 2C9 
Gly Phe He Ala Ser Trp Met Val Lys Leu Leu Leu Asp Lys Glv Tyr 
25 30 35 

ACT GTT AGA GGA ACT GCG AGG AAC CCA GCT GAT CCC AAG AAT TCT CAT 2 57 

Thr val Arc Gly Thr Ala Arg Asn Pro Ala Asp Pro Lys Asn Ser His 
4 0 4 5 5 0 

TTG AGG GAG CTT GAA GGA GCT GAA GAA AGA TTA ACT TTA TGC AAA GCT 3 05 

Leu Arg Glu Leu Glu Gly Ala Glu Glu Arg Leu Thr Leu Cys Lys Ala 
55 60 65 

GAT CTT CTT GAT TAT GAG TCT CTT AAA GAG GGT ATT CAA GGG TGT GAT 3 53 

Asp Leu Leu Asp Tyr Glu Ser Leu Lys Glu Gly lie Gin Gly Cys Asp 
10 75 80 85 

GGT GTT TTC CAC ACT GCT TCT CCT GTC ACA GAT GAT CCG GAA GAA ATG 4 01 

Gly Val Phe Kis Thr Ala Ser Pro Val Thr Asp Asp Pro Glu Glu Met: 
90 95 100 

GTG GAG CCA GCA GTG AAC GGG ACC AAA AAT GTG ATA ATT GCG GCG GCT 44 9 

Val Glu Pro Ala Val Asn Gly Thr Lys Asn Val lie lie Ala Ala Ala 
105 110 H5 

GAG GCC AAA GTC CGA CGA GTG GTG TTC ACG TCA TCA ATT GGC GCT GTG 4 97 

Glu Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser lie Gly Ala Val 
120 125 130 



TAC ATG GAT CCC AAT AAG GGC CCA GAT GTT GTC ATT GAT GAG 
Tyr Met Asp Pro Asn Lys Gly Pro Asp Val Val lie Asp Glu 
135 140 14 5 



TCT TGC 

Ser Cys 



545 
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TGG AGT GAT CTT GAA tt^ tv*/~ ^ * 

^ TT '^ TGC ^ ACC AAG AAT TGG TAT TGC TAT 

's Asn Thr Lys Asn Trp Tyr Cv^ 

155 



Trp ser Asp Leu Glu Phe Cys Lys Asn Thr Lvs Asn Tr C Tvr c~ T 

150 -- ' ' ^ r 



160 16! 



«A «» OCT GTG Gii c « 0C T m TGG GAT m GCT „G ^ 

17^ 

" 175 

180 



-3G GTG GAG CTA GTG GTG GTT AAC CCA GTG CTG GTG ~T- r- 

^- lKJ "oio ^l: Gvjm CCA T"pq 

-ly Val Asp Leu Val Val Val Asn Pro Val Leu w _ _ 

vax Leu ,ai Leu G_iv p ro Leu 

Leu Gin Pro Thr Val Asn Ala Ser 1 1 - T h- Hi <■ ti « t 

An - Hls He Leu Lys Tyr Leu 

2. 0 0 -> 0 s 

D 210 



>--CC GGC TCA GCC AAG AC£ TAT r-r-r r ~ ~ 

iAr GCT Aau TCT GTT CAA Qnn- T 

215 220 225 



CTA GCC CAC ATT TTA GTC TTT GAG ACG CCT TCC 

Glu Thr Pro Ser 



GTT AGG GAT GTG GCA 

Val Arg Asp Val Ala Leu Ala His He Leu Val Ph . 
«la Ser Gly Arg Tyr Leu Cys Ser Glu Ser Val Leu 



250 , c _ 

25 = 260 



Val Val Clu Ile Leu Ala Lys phe phe ^ e ^ ibr 

270 2?5 

AAG TGC TCA GAT GAG AAG AAC CCA AGA AAA CAA CCT TAC AAG TTC TCA 

280 9 oE 

285 290 

295 300 305 



689 



'AT GTG CAT 76 5 

is 



833 



GAG 8 8 j 

His Arg Gly Glu 



929 



97' 



1025 
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TGT CTG TAT GAA ACT GTT AAG AGT TTG CAG GAA AAG GGT CAC CTT CCA 
Cys Leu Tyr Giu Thr Val Lys Ser Leu Gin Glu Lys Gly His Leu Pro 
31C 315 320 325 



1073 



CAA OCT GCA GAA GAG TCT TTG AAA ATT CAA TAAGGCCTCT ± 12 2 
lie Pro Lys Gin Ala Ala Glu Glu Ser Leu Lys He Gin 
330 335 

TGGAACTATT TATTAGGATT GTTCCATACC CCAAGTTTGG ATCGCAAATG CTAGGGAAAG 118 2 

GAG CAT ATT A AAGAATGCCA ATGTGCAGGT GTTTTAGTAT TTTACATGAA GAACTCTGAT 124 2 

T A T C C TTG TG CTTATAA.TAA TTTTTTTCAA GTGAGTGTCT TCAAATGTTC AACTTGTATT 13 02 

7GTGGTTGTC TAACTTTATC CAGTTTCAAT ATAAAAGAGG AACGATTCTA TGTCTTAAAA 136 2 



A^^K^-AAAJkA AAAA 



137t 



INFORMATION POUR LA SEQ ID NO: 8: 

fi) CARACTERISTIQUES DE LA SEQUENCE: 
■:A; LONGUEUR: 3 38 acides amines 
(6) TYPE: acide amine 
\D) CONFIGURATION: lineaire 

(ii; TYPE DE MOLECULE: proteine 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 



Met Pro Val Asp Ala Ser Ser Leu Ser Gly Gin Gly Gin Thr He Cys 

15 10 is 

Val Thr Gly Gly Gly Gly Phe He Ala Ser Trp Met Val Lys Leu Leu 

20 25 30 



Leu Asp Lys Gly Tyr Thr Val Arg Gly Thr Al 
35 40 



a Arg Asn Pro Ala Asp 
45 



WO 97/12982 
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, y , As „ ser Hi , Le „ Arg Mu ou ^ ^ 

50 5 ^ 

60 

3 8 0 



He Gin 

85 



v Cys Asp Gly Val Phe His Thr * * c 

5 inr rt " La Ser Pro Val Thr Asp 



50 95 



Asp Pro GIu Glu Met Val Glu Pro 



Aia Val Asn Gly Thr Lys Asn Val 
100 105 

110 

Ser He Gly Ala Val Tyr Met Asp Pro Asn t vs r1 .. D „ 

r <-> «sn ^ys Gly Pro Asp Val Val 

14 0 



He Asp Glu Ser 
145 



Cys Trp ser Asp Leu Glu Phe Cys Lys Asn Thr Lvs 

150 1C _ 

15d 160 

Oln Ala ryr Val „ is Val Ar g Asp Val Ala Leu Ala Hls Ile Leu 

230 

ZJb 240 

Phe Glu Thr Pro Ser Ala Ser Gly Arq Tvr lpp r c 

x> Mrg i>r Leu Cys Ser 

245 250 

^ 255 
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Leu His Arg Gly Glu Val Val Glu He Leu Ala Lys Phe Phe 
260 265 



*e Pre Glu 



Tyr Pro lie Pro Thr Lys Cys Ser Asp Glu Lys Asn Pro Arg Lys Gin 
275 280 285 

Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Phe Glu Phe 
290 295 300 

Thr Pro Vai Lys Gin Cys Leu Tyr Giu Thr Val Lys Ser Leu Gin Glu 

305 310 315 320 

Lys Gly His Leu Pro He Pro Lys Gin Ala Ala Glu Glu Ser Leu Lys 

325 330 335 



lie Gin 



i2) INFORMATION POUR LA SEQ ID NO; 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

{A* LONGUEUR: 12 7 3 paires de bases 
<B> TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(ix) CARACTERISTIQUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
{ B ) EMPLACEMENT : 6 6 .. 1 0 9 1 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

TCGTAGCTCT TCCCTTTCAC CAACAAGCTA GTTTAGACAA GTACAGTGGT ACTGTAAGAG 

CAACA ATG ACC GTT GTC GAC GCC GCC GCG CCG CAG CTG CCT GGC CAT 
Met Thr Val Val Asp Ala Ala Ala Pro Gin Leu Pro Gly His 



WO 97/12982 
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GGG CAG ACC GTG TGC GTC ACC GGC GCC GCG GGG TAG 



r,l„ ^ „u„ _ " ^ ° CG TCG GGG 15£ 

a Ala Gly Tyr lie Ala Ser Gly 

25 3 C 



Gly Gin Thr Val Cys Val Thr Gly Al 
15 20 



CTC GTC AAG CTG CTC CTG GAG AGA GGC TAC ACC GTG AAG GGC ACA GTG 



Leu Val Lys Leu Leu Leu Glu Arg Gly Tyr Thr V< 



■ys Gly Thr Val 



Jt > 40 

4 5 



-.GC 



— AAC CCA GAT GAT CCC AAG AAC GCC CAC CTG AAG GCC CTG GAC GGC 
Arg ash Pro Asp Asp Pro Lys Asn Ala Hi 



Us Leu Lys Ala Leu Asp Gly 



50 55 

^ b 6 0 



GCC ACC AAG AGG CTG ATC CTC TGC AAA GCC GAC CTC CTC GAC TAC GAC 

=P Tyr Asp 



Ala Thr Lys Arg Leu He Leu Cys Lys Ala Asp Leu Leu A, 



65 



70 



GCC ATA TGC GCC GCC GTC GAG GGC TGC CAC GGC GTG TTC CAC ACC 



Mia He Cys Ala Ala Val Glu Gly Cys His Gly Val Phe Hx 



80 



GCC 
s Thr Ala 



85 



90 



TCT CCA GTC ACC GAT GAT CCT GAG CAG ATG GTG GAG CCG GCG GTG CGG 
Ser Pro Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val 



Arc 
100 



Gly Thr Glu Tyr Val He Asn Ala Ala Ala Asp Ala Glv Thr Val Aro 
Arg Val Val Phe Thr Ser Ser He Gly Ala He Thr Met Asp Pro As^ 
Arg Gly Pro Asp Val Val Vftl Asn ^ ^ ^ ^ ^ ^ ^ ^ 

TTC TGC AAG AAA ACC AAG AAC TGG TAC TGC TAC GGC AAG GCC GTG GCG 

Phe Cys Lys Lys Thr Lys Asn Trp Tyr n vs Tvr r . T 

^ -y s T Y r Gly Lys Ala Val Ala 

165 i7c 



203 



251 



299 



195 



44 3 



491 



539 



587 
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GAG CAG GCT GCG TGG GAG GCG GCC AGG AAG CGC GGC ATC GAC CTC GTC 6 35 

Glu Gin Ala Ala Trp Glu Ala Ala Arg Lys Arg Gly lie Asp Leu Val 

17 5 180 185 190 

GTC GTG AAC CCT GTG CTC GTG GTA GGG CCG CTG CTG CAA CCA ACG GTG 683 
Val Val As n Pro Val Leu Val Val Gly Pro Leu Leu Gin Pro Thr Val 
195 20C 205 

AAC GCT AGC GCC GCA CAC ATC CTC AAG TAC CTC GAC GGC TCG GCC AAG 73 i 

Asn Ala Ser Ala Ala His lie Leu Lys Tyr Leu Asp Gly Ser Ala Lys 
210 215 22 0 

AAG TAC GCC AAC GCT GTG CAG TCA TAC GTA GAC GTG CGT GAC GTA GCC 77 S 

Lys Tyr Ala Asn Ala Val Gin Ser Tyr Val Asp Val Arg Asp Val Ala 
2 2 5 2 3 0 2 2 5 

GGC GCG CAC ATC CGG GTG TTC GAG GCG CCT GAG GCG TCG GGC CGG TAC 32 7 

Gly Ala His lie Arg Val ?he Glu Ala Pre Glu Ala Ser Gly Arg Tyr 
240 245 250 

CTC TGC GCC GAG CGC GTG CTG CAC CGT GGG GAC GTT GTC CAA ATC CTC 8 75 

Leu Cys Ala Glu Arg Val Leu His Arg Gly Asp Val Val Gin lie Leu 
255 260 265 2 7 0- 

AGC AAA CTC TTG CCT GAG TAC CCT GTG CCA ACA AGG TGC TCT GAT GAA 92 2 

Ser Lys Leu Leu Pro Glu Tyr Pro Val Pro Thr Arg Cys Ser Asp Glu 
275 280 285 

GTG AAC CCA CGG AAG CAG CCT TAT AAG ATG TCC AAC CAG AAG CTG CAG 97 1 

Val Asn Pro Arg Lys Gin Pro Tyr Lys Met Ser Asn Gin Lys Leu Gin 
290 295 300 

GAT CTT GGC CTC CAG TTC ACT CCT GTG AAC GAC TCT CTG TAT GAG ACC 1019 
Asp Leu Gly Leu Gin Phe Thr Pro Val Asn Asp Ser Leu Tyr Glu Thr 
305 310 315 



GTG AAG AGC CTC CAG GAG AAG GGA CAT CTC CTA GTA CCA AGC AAA CCC 
Val Lys Ser Leu Gin Glu Lys Gly His Leu Leu Val Pro Ser Lys Pre 
320 325 330 



1067 



WO 97/12982 

GAG GGA TTA AAC GGT GTA ACG 



PCT/FR96/0I544 



54 - 



GCA TGATACTGCT AAAGAAGCAG CAGAG" n TCA'" 
Gly Leu Asn Gly Val Thr Ala 



3 3 5 



340 



112 1 



GTGCTCCTGT AACATGGTCA AACATGAGTT GTTTTTCTGT ATAAATTCTA TCCAGTATCG ll81 
TGTTATTTAA GTGAACTAAG AGAACAGAAT ATTG T ATC AT CTTCGATGTC CAATACCTGG 1241 
AAGTGATTTG TTTTGCCACC TAAAAAAAAA AA 

1273 

■ 2 - INFORMATION- POUR LA SEQ ID NO: 10: 

:i. CAKACTERISTIQUES DE LA SEQUENCE : 
!A> LONGUEUR: 342 acides 'amines 
(3: TYPE: acide amine 
(O; CONFIGURATION: lineaire 



TY?E DE MOLECU 



i-- : proceine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 



10 



Thr Val Cys Val Thr Gly 
20 



y Ala Ala Gly Tyr lie 
25 



15 

Ala Ser Gly Leu Val 
30 



Lys Leu Leu Leu Glu 
35 



Arg Gly Tyr Thr Val Lys Gly Thr Val Arg Asn 



40 



Pre Asp Asp Pro Lys Asn Ala His Leu 

50 



55 



Lvs Arg Leu lie Leu Cys Lys Al 
65 70 



45 

Lys Ala Leu Asp Gly Ala Thi 
60 



a Asp Leu Leu Asp Tyr Asp Ala I 
75 



80 



Cys Ala Al 



a Val Glu Gly Cys His Gly 
85 



Val Phe His Thr Ala Ser Pro 

90 95 
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Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val Arg Gly Thr 
100 105 no 

Glu Tyr Val lie Asn Ala Ala Ala Asp Ala Gly Thr Val Arg Arg Val 
115 • 120 125 

Val Phe Thr Ser Ser lie Gly Ala lie Thr Met Asp Pre Asn Arg Gly 
130 135 140 

Pre Asp Val Val Val Asn Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys 
H5 150 155 160 

Lys Lys Thr Lys Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Gin 
165 170 175 

Ala Ala Trp Glu Ala Ala Arg Lys Arg Gly lie Asp Leu Val Val Val 
180 185 190 

Asn Pro Val Leu Val Val Gly Pro Leu Leu Gin Pro Thr Val Asn Ala 
195 200 205 

Ser Ala Ala His lie Leu Lys Tyr Leu Asp Gly Ser Ala Lys Lys Tyr 
210 215 220 

Ala Asn Ala Val Gin Ser Tyr Val Asp Val Arg Asp Val Ala Gly Ala 
225 230 235 240 

His He Arg Val Phe Glu Ala Pro Glu Ala Ser Gly Arg Tyr Leu Cys 
245 250 255 

Ala Glu Arg Val Leu His Arg Gly Asp Val Val Gin lie Leu Ser Lys 
260 265 270 

Leu Leu Pro Glu Tyr Pro Val Pro Thr Arg Cys Ser Asp Glu Val Asn 
275 280 285 



Pro Arg Lys Gin Pro Tyr Lys Met Ser Asn Gin Lys Leu Gin Asp Leu 
290 295 300 



WO 97/12982 
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Z *~ V " «" "» ryr „» Thr v „ Lys 

Leu Asn Giy Val Thr Ala 
340 



12; INFORMATION POUR LA SEQ ID NO : 11 : 

ii) CARACTERISTIQUES DE LA SEQUENCE : 

•A, LONGUEUR: 1293 paires de bases 
(E) TYPE: acide nucleique 
;c- NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(xi) TYPE DE MOLECULE: ADNc pour ARNm 

fix) CARACTERISTIQUE ADDITIONELLE : 
■:a) NOM/CLE: CDS 
(B) EMPLACEMENT: 9 5..H08 

txi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 11: 

CCGAGCCTAT TTCTTCCCTA TATCCACTCA TCCTTGTCTT ATATCATCAT CATCATCATC 

TACCTAAACC TGAGCTCAAC AGAAAAGTAA TACC ATG CCG TCA GTT TCC GGC 

Met Pro Ser Val Ser Civ- 



il; 



-C GTT TGT GTT ACT GGC GCC GGA GGT TTC ATC GCC TCT TGG CTC 
GTT AAA ATT CTT CTG GAA AAA GGC TAG ACT GTT an* ^ 

Va1 t AGA GGA ACA GTA CGA 2 06 

Val Lys He Leu Leu Glu Lys Gly Tvr Thr- „ , » 

X ■ Thr Val Ar 9 Gly Thr Val Arg 
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AAT CCA GAT GAT CGA AAA AAT AGT CAT TTG AGG GAG CTT GAA CGA GCA 2 
Asn Pro Asp Asp Arg Lys Asn Ser His Leu Arg Glu Leu Glu Arq Ala 
4 0 4 5 50 

AAA GAG AC A TTG ACT CTG TGC AG A GCT GAT CTT CTT GAT TTT CAG AGT 3C 
Lys Glu Thr Leu Thr Leu Cys Arg Ala Asp Leu Leu Asp Phe Gin Ser 
55 60 6 5 7C 

TTG CGA GAA GCA ATC AGC GGC TGT GAC GGA GTT TTC CAC AC A CGT TCT 3 5 

Leu Arg Glu Ala He Ser Gly Cys Asp Gly Val Phe His Thr Arg Ser 
?5 80 S5 

CCT GTC ACT GAT GAT CCA GAA CAA ATG GTG GAG CCA GCA GTT ATT GGT 4 0 

Pre Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val He Gly 
90 95 IOC 

ACA AAG AAT GTG ATA ACG GCA GCA GCA GAG GCC AAG GTG CGA CGT GTG 4 4 

Thr Lys As- Val He Thr Ala Ala Ala Glu Ala Lys Val Arg Arg Val 
105 110 us 

GTG TTC ACT TCG TCA ATT GGT GCT GTG TAT ATG GAC CCA AAC AGG GAC 4 9 

Val Phe Thr Ser Ser He Gly Ala Val Tyr Met Asp Pro Asn Arg Asp 
12C 125 130 

CCT GAT AAG GTT GTC GAC GAG ACT TGT TGG AGT GAT CCT GAC TTC TGC 54 4 

Pro Asp Lys Val Val Asp Glu Thr Cys Trp Ser Asp Pro Asp Phe Cys 
135 140 145 150 

AAA AAC ACC AAG AAT TGG TAT TGT TAT GGG AAG ATG GTG GCA GAA CAA 5 92 

Lys Asn Thr Lys Asn Trp Tyr Cys Tyr Gly Lys Met Val Ala Glu Gin 
155 160 165 

GCA GCA TGG GAC GAA GCA AGG GAG AAA GGA GTC GAT TTG GTG GCA ATC 64 0 

Ala Ala Trp Asp Glu Ala Arg Glu Lys Gly Val Asp Leu Val Ala He 
170 175 180 



AAC CCA GTG TTG GTG CTT GGA CCA CTG CTC CAA CAG AAT GTG AAT GCC 
Asn Pro Val Leu Val Leu Gly Pro Leu Leu Gin Gin Asn Val Asn Ala 



688 
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ACT CTT CTT CAC ATC CAC AAG TAC CTA ACT GGC TCT OCT AA." AC" 

Ser val Leu H iS i le „ ia Lvs T _ r eu Thr , " ^ 

. * i,- -eu Thr Gly ber Ala Lvs Th 

200 205 210 ' 



ACG TCC AAT TCA CTT CAG GCA TAT G~T r A -r GTT 

u - i LAT GTT Aou GhT GTG GCT TTA 
Thr Ser Asn Ser Leu Gin Ala Tvr Val Hie * 

- ' al hls Ar S --sp val Ala Leu 

225 230 

V ^ ^ Glu ^ *~ ^r Ala Ser Gly Arg Tyr ^ 

2 3 c 

*" 2 4^ 



TGT GCC GAG AGT GTG CTG CAT CGC TGC GAT 

Cys Ala Glu Ser Val Leu His Arg C vs Aso w- 1 nl T1 

y v ^op v a l Glu He Leu 



GTG GTT GAA ATT CTC GCC 

Ala 



250 2 

" => - 260 



AAA TTC TTC CCG GAG TAT CCT 

ir Lys Cys Ser Asp Val Thr 



270 



AAG CCA AGG GTA AAA CCG TAC AAA TTC TCA AAC CAA AAG CTA AAG GAT 

285 



290 



736 



784 



831 



88 0 



ATC CCC ACC AAG TGT TCA GAT GTG ACG 9 - 8 
Lys Pne Phe Pro Glu Tyr Pro He P ro Th! 
265 



976 



1024 



295 

ACT CTA CAA GAG AAA GGT CAC CTT CCA ATT CCT ACT CAA AAG GAT GAG 

Ser Leu Gin Glu Lys Gly K is Leu Pro ll e Pro Thr Gin t * 

fro inr Gin Lys Asp Glu 

ATT ATT CGA ATT CAG TCT GAG AAA TTC AGA AGC TCT TAGCATGTAT 
He lie Arg He Gin Ser Glu Lys Phe Arg Ser Ser 
330 335 

TGAGGAAAAG GGATCAATGG TTAAAGTTGA CCATGGCGTT GTCCCTTTAT GTACCAAGAC 1178 
CAAATGCACC TAG AAA TTA CTTGTCTACT CTGTTGTACT TTTACTTGTC ATGGAAATGT i23 e 
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TTTTAGTGTT TTCATTGTTA TGAGATATAT TTTGGTGTAA AAAAAAAAAA AAAAA 



t'2; INFORMATION POUR LA SEQ ID NO: 12: 

• z.) C ARAC T E R I S T I Q UE S DE LA SEQUENCE: 
' A ' LONGUEUR: 3 38 acides amines 
: .B> TYPE; acide amine 
O" CONFIGURATION : lmeaire 

:n" TYPE CE MOLECULE: proteine 

DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Pro Ser Val Ser Gly Gin lie Val Cys Val Thr Gly Ala Gly Gly 
1 ^ 10 15 

Phe lie Ala Ser Trp Leu Val Lys lie Leu Leu Glu Lys Gly Tvr Thr 
20 25 30 

Val Arc Gly Thr Val Arg Asn Pro Asp Asp Arg Lys Asn Ser His Leu 
35 40 45 

Arg Glu Leu Glu Arg Ala Lys Glu Thr Leu Thr Leu Cys Arg Ala Asp 
= C- 55 60 

Leu Leu Asp Phe Gin Ser Leu Arg Glu Ala lie Ser Gly Cys Asp Gly 
65 70 75 80 

Val Phe His Thr Arg Ser Pro Val Thr Asp Asp Pro Glu Gin Met Val 
85 90 95 

Glu Pro Ala Val He Gly Thr Lys Asn Val He Thr Ala Ala Ala Glu 
100 105 110 

Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser He Gly Ala Val Tyr 
115 120 125 



1293 
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60 

130 135 

140 

Ser Asp Pro Asp Phe Cys Lys Asn Th>- T . 

' yS ASn Thr L / s Asn Trp Tyr Cys Tyr Gly 
14 D 150 

155 

3:5 160 
'-v. Met vai Ala Glu Gln Ala Aia Trp a ^ ^ ^ ^ 

165 170 17S 

185 190 

Gin Gin Asn Val Asn Ala Ser Val Leu Hiq rio - T 

^ eu Hls Ile «is Lys Tyr Leu Thr 

195 200 20' 

Gly Ser Ala Lvs T.^r T* Thr c « * 

. ' ~ Thr Sei Asn s " Leu Gin Ala Tvr Vai His 

245 2 *0 25E 

Val Val Glu Ile Leu Ala Lys phg phg T ^ p ^ ^ ^ 

260 26s 
-/s Cys Ser As p Val Thr Lys Pro Arg Val Lys ^ ^ ^ 

280 285 

2 90 295 

" 300 



Tyr Gi , Thr val Ly . s „ Leu ^ ^ 

325 



330 335 



Ser Se: 
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(2; INFORMATION POUR LA SEQ ID NO: 13: 



;i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12S7 paires de bases 
{ B ) TYPE: acide nucleique 

fC) NOMBRE DE BRINS : double 
iD) CONFIGURATION: lineaire 

•li) TYPE DE MOLECULE: ADNc pour ARNm 

ii:-:> CARACTERISTIQUE ADDITIONELLE : 
(A; NOM/CLE: CDS 

( B ) EMPLACEMENT : 1 3 6 . . 1 1 4 0 

•xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 13: 

CGGCCGGG AC GACCCGTTCC TCTTCTTCCG GGTCACCGTC ACCA.TGTTAC ACAACATCTC 6 0 

CGGCTAAAAA AAAAAGGAAA AAAAGCGCAA CCTCCACCTC CTGAACCCCT CTCCCCCCTC 120 

GCCGGCAATC CCACC ATG CCC GTC GAC GCC CTC CCC GGT TCC GGC CAG ACC 171 
Met Pro Val Asp Ala Leu Pro Gly Ser Gly Gin Thr 
15 10 

GTC TGC GTC ACC GGC GCC GGC GGG TTC ATC GCC TCC TGG ATT GTC AAG 219 
Val Cys Val Thr Gly Ala Gly Gly Phe He Ala Ser Trp He Val Lys 
15 20 25 

CTT CTC CTC GAG CGA GGC TAC ACC GTG CGA GGA ACC GTC AGG AAC CCA 26 7 

Leu Leu Leu Glu Arg Gly Tyr Thr Val Arg Gly Thr Val Arg Asn Pro 
30 35 40 

GAC GAC CCG AAG AAT GGT CAT CTG AGA GAT CTG GAA GGA GCC AGC GAG 315 
Asp Asp Pro Lys Asn Gly His Leu Arg Asp Leu Glu Gly Ala Ser Glu 

45 50 55 60 

AGG CTG ACG CTG TAC AAG GGT GAT CTG ATG GAC GAC GGG AGC TTG GAA 36 3 

Arg Leu Thr Leu Tyr Lys Gly Asp Leu Met Asp Asp Gly Ser Leu Glu 

65 70 ~5 
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GTC 



GAA GCC ATC AAG GGG TGC GAC GGC GTC GTC CAC ACC GCC TCT CCG 
Glu Ala lie Lys Gly Cys Asp Gly Val Val Hxs Thr Ala Ser Pr „ V al 
80 



ACC GAC GAT CCT GAG CAA ATG GTG GAG CCA GCG GTG ATC GGG ACG 
Thr Asp Asp Pro Glu Gin Met Val Glu Pre Ala Val He Gly Thr Lys 



AAA 



1°° 10; 



AAT GTG ATC GTC GCA GCG GCG GAG GCC AAG GTC CGG CGG GTT 



isn Val He Val Ala Ala Ala Glu Ala Lys Val A 



GTG TTC 
rg Arg Val Val Phe 



AAG AAC TGG TAT TGC TAC GGC AAG GCA GTG GCG GAG AAG GCC GCT TGG 
Lys Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Lys Ala Ala T.p 

CCA GAG GGC AAG GAG AGA GGG GTT GAC CTC GTG GTG ATT AA.C CCT GTG 
Pro Glu Gly Lys Glu Arg Gly Val Asp Leu Val Val He Asn Pro Val 

CTC GTG CTT GGA CCG CTC CTT CAG TCG ACG ATC AAT GCG AGC ATC ATC 
Leu val Leu Gly Pro Leu Leu Gin Ser Thr lie Asn Ala Ser He lie 



190 



195 



200 



GTC CAG GCG TAC GTG CAC GTC AAG GAC GTC GCG CTT GCC CAC GTC CTT 

Val Gin Ala Tyr Val His Val Lys Asp Val Ala Leu Ala His Val Leu 

*"> *"> C _ 

— 230 



4 11 



459 



507 



55E 



110 ■ 120 

ACC TCC TCC ATC GGT GCA GTC ACC ATG GAC CCC AAC CGG GCA GAC GTT 
Ser Ser Tie Glv Ala Val Thr Mec Asp Pro Asn Arg ^ ^ 

GTG GTG GAC GAG TCT TGT TGG AGC GAC CTC GAA TTT TGC AAG AGC AC- 
Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Lvs Ser Thr 
145 



651 



699 



74' 



Hxs He Leu Lys Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser 

205 210 215 

Z15 220 



843 



!3 5 
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GTC TTG GAG ACC CCA TCC GCC TCA GGC CGC TAT TTG TGC GCC GAG AGC 891 

Val Leu Giu Thr Pro Ser Ala Ser Gly Arg Tyr Leu Cys Ala Glu Ser 
240 245 250 

GTC CTC CAC CGT GGC GAT GTG GTG GAA ATC CTT GCC AAG TTC TTC CCT 93 9 

Val Leu His Arg Gly Asp Val Val Glu lie Leu Ala Lys Phe Phe Pro 
255 260 265 

GAG TAT AAT GTA CCG ACC AAG TGC TCT GAT GAG GTG AAC CCA AGA GTA 98 7 

Glu Tyr Asn Val Pro Thr Lys Cys Ser Asp Glu Val Asn Pre Arg Val 
270 275 280 

AAA CCA TAG AAG TTC TCC AAC CAG AAG CTG AGA GAC TTG GGG CTC GAG 1C3 5 

Lys Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Leu Giu 
235 29C 295 300 

TTC ACC CCG GTG AAG CAG TGC CTG TAC GAA ACT GTC AAG AGC TTG CAG 108 3 

Phe Thr Pro Val Lys Gin Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin 
305 310 315 

GAG AAA GGC CAC CTA CCA GTC CCC TCC CCG CCG GAA GAT TCG GTG CGT 1131 
Giu Lys Giy His Leu Pro Val Pro Ser Pro Pro Glu Asp Ser Val Arg 
320 325 33C 

ATT CAG GGA TGATCTTAGA TCCATCACGG TGCGCATTTG TAATCCGGAG 11 B0 

He Gin Gly 
335 

AAATGAGAGA AACATGTGGG AATTTGTTTG TACTTTTCTA AGTCAAACCT GGAGATACCA 124 0 

ACCCTGAGTT CTG CATTGG A ATGGAAGTTG TCAATTGTTC CAA.AAAAAAA AAAAAAA 12 9 7 



(2; INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 5 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lmeaire 
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(Hi TYp E DE MOLECULE : proceine 

(y.l: DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 14: 

1 Q 

30 



lr9 Gli ' T '' r Thr Val Arg Gly Thr Vai Arg Asn 

3 5 



Pro Asp Asp Pro Lys 
40 , ~ 

4 D 



Asn Gly h,s Leu Arg Asp Leu Glu Gly Ala Ser Glu Arg Leu Thr ^ 

S ° 

T'/r Ly S Gly Asp Leu Mec Asp Asp Qly ^ ^ ^ ^ ^ ^ 

65 70 

D 8 0 

Ala Ala Ala Glu Ala Lys Val Arg Arg Val Val P he Thr Ser Ser He 

Ser cy s Trp Ser Asp Leu Qlu phe Cys ^ ^ ^ ^ ^ ^ ^ 

14:> 150 



155 16C 



-YS Tyr Gly Lys Ala Val Ala Glu Lys Ala Al 

170 



a Trp Pro Glu Glv Lvs 

165 

175 



180 
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Pre Leu Leu Gin Ser Thr lie Asn Ala Ser lie lie His lie Leu Lys 
155 200 205 

Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser Val Gin Ala Tyr 
21C 215 220 

Val His Val Lys Asp Val Ala Leu Ala His Val Leu Val Leu Glu Thr 
225 230 235 240 

Pro Ser Ala Ser Gly Arg Tyr Leu Cys Ala Glu Ser Val Leu His Arg 
245 250 255 

Gly Asp Val Val Glu lie Leu Ala Lys Phe Phe Pro Glu Tyr Asn Val 
26 0 265 27 0 

Pro Thr Lys Cys Ser Asp Glu Val Asn Pro Arg Val Lys Pro Tyr Lys 
2^5 280 285 

Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Leu Glu Phe Thr Pro Val 
290 295 300 

Lys Gin Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin Glu Lys Gly His 
305 310 315 320 

Leu Pro Val Pro Ser Pro Pro Glu Asp Ser Val Arg lie Gin Gly 
325 330 335 



v. 
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REVENDICATIONS 



1. Utilisation de sequences nucleotidiques recombinantes contenani une 
(ou plusieurs) region(s) codante(s). cette (ces) region(s) codante(s) etant 
constituee(s) d une sequence nucleotidique chois.e parmi les suivantes: 

- la sequence nucleotidique representee par SEQ ID NO 1 . codant pour 
un ARNm, cet ARNm codant lui-meme pour la cinnamoyl CoA reductase 
(CCR) de luzerne representee par SEQ ID NO 2. 

- la sequence nucleotidique representee par SEQ ID NO 3. codant pour 
un ARNm, cet ARNm codant lui-meme pour la CCR de ma is representee par 
SEQ ID NO 4, 

- un fragment de la sequence nucleotidique representee par 
SEQ ID NO I. ou de celle representee par SEQ ID NO 3. ce fragment codant 
pour un fragment de la CCR representee par SEQ ID NO 2 ou pour un 
fragment de la CCR representee par SEQ ID NO 3. respect.vement. ce 
fragment de CCR presentant une activite enzymatique equivalente a celle des 
deux CCR susmentionnees, 

- la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1 ou SEQ ID NO 3, cette sequence complementaire codant pour 
un ARNm antisens susceptible de s'hybrider avec 1' ARNm code par les 
sequences SEQ ID NO 1 et SEQ ID NO 3, respect! vement. 

- un fragment de la sequence nucleotidique complementaire de celle 
representee par SEQ ID NO 1 ou SEQ ID NO 3, ce fragment de sequence 
codant pour un ARNm antisens susceptible de s'hybrider avec l'ARNm codant 
lui-meme pour la CCR representee par SEQ ID NO 2. ou avec l'ARNm 
codant lui-meme pour la CCR representee par SEQ ID NO 4. respectivement. 

- la sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 ou SEQ ID NO 3, notamment par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
derivee codant soit pour un ARNm codant lui-meme pour la CCR representee 
par SEQ ID NO 2 ou SEQ ID NO 4 respectivement, ou pour un fragment ou 
une proteine derivee de ces dernieres, ce fragment ou proteine derivee 
presentant une activite enzymatique equivalente a celle desdites CCR chez les 
plantes, 

- la sequence nucleotidique derivee de la sequence nucleotidique 
complementaire susmentionnee. ou du fragment de cette sequence 
complementaire tel que decrit ci-dessus. par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
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derivee codant pour un ARNm antisens susceptible de s'hybrider avec un des 
ARNm susmentionnes, 

pour la transformation de cellules vegetales en vue de lobtention de plantes 
transgeniques au sein desquelles la biosynthese des lignines est regulee soit 
dans le sens d'une augmentation, soit dans le sens d'une diminution des 
teneurs en lignines produites, par rapport aux teneurs normales en lignines 
produites chez les plantes. 

2. Sequence d'ADN. caracterisee en ce qu'elle comprend a litre de 
region codante: 

- la sequence nucleotidique representee par SEQ ID NO 1 . codant pour 
un ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, ou 

- un fragment de la sequence nucleotidique susmentionnee, ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 2, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmentionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 susmentionnee, ou d'un fragment tel que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 2, 
ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

3. Sequence d'ADN, caracterisee en ce qu'elle comprend a titre de 
region codante: 

- la sequence nucleotidique representee par SEQ ID NO 3, codant pour 
ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 4, ou 

- un fragment de la sequence nucleotidique susmentionnee, ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 4, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmentionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 3, susmentionnee, ou d'un fragment tel que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 4. 
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ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

4. Sequence d'ADN. caracterisee en ce qu'elle comprend a titre de 

region codante: 

*pn Jl~ qUenCt nUC,6 ° tidiqUe cor "P'e m enta,re de celle representee par 
SEQ ID NO 1. cette sequence complementaire codant pour un ARNm ant.sens 
susceptible de s'hybrider avec I'ARNm codant lui-meme pour la CCR 
representee par SEQ ID NO 2. a savoir I'ARNm code par la sequence 
representee par SEQ ID NO 1 , ou code par une sequence derivee de cette 
derniere, telle que definie dans la revendication 2, ou 

- un fragment de la sequence complementaire susmentionnee ce 
fragment de sequence codant pour un ARNm antisens susceptible de 
s'hybrider avec I'ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, tel que defini ci-dessus, ou 

- toute sequence nucleotidique derivee de la sequence complementaire 
susmentionnee, ou du fragment de cette sequence complementaire tel que 
decrit ci-dessus. notamment par mutation et/ou addition, et/ou suppression 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm antisens susceptible de s'hybrider avec I'ARNm susmentionne. 

5. Sequence d'ADN. caracterisee en ce qu'elle comprend a titre de 
region codante: 

- la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 3, cette sequence complementaire codant pour un ARNm antisens 
susceptible de s'hybrider avec I'ARNm codant lui-meme pour la CCR 
representee par SEQ ID NO 4, a savoir I'ARNm code par la sequence 
representee par SEQ ID NO 3, ou code par une sequence derivee de cette 
derniere. telle que definie dans la revendication 3, ou 

- un fragment de la sequence complementaire susmentionnee. ce 
fragment de sequence codant pour un ARNm antisens susceptible de 
s'hybrider avec I'ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 4, tel que defini ci-dessus, ou 

- toute sequence nucleotidique derivee de la sequence complementaire 
susmenttonnee. ou du fragment de cette sequence complementaire tel que ' 
decr.t ci-dessus. notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm antisens susceptible de s'hybrider avec I'ARNm susmentionne 
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6. ARNm code par une sequence d'ADN selon 1'une des revendications 
2 a 5, et plus particulierement: 

- l'ARNm code par la sequence d'ADN representee par SEQ ID NO 1, 
ou code par un fragment ou une sequence derivee tels que definis dans la 
revendication 2. ledit ARNm etant susceptible de coder a son tour pour la 
CCR presente chez la luzerne, telle que representee par SEQ ID NO 2, ou 
pour un fragment de cette CCR ou une proteine derivee tels que definis dans la 
revendication 2, 

- l'ARNm code par la sequence d'ADN representee par SEQ ID NO 3, 
ou code par un fragment ou une sequence derivee tels que definis dans la 
revendication 3. ledit ARNm etant susceptible de coder a son tour pour la 
CCR presente chez le mais, telle que representee par SEQ ID NO 4. ou pour 
un fragment de cette CCR ou une proteine derivee tels que definis dans la 
revendication 3. 

7. ARNm antisens. caracterise en ce qu'il comprend des nucleotides 
complementaires de la totalite ou d'une partie seulement des nucleotides 
constituant un ARNm selon la revendication 6, et en ce qu'il est susceptible de 
s'hybrider avec ce dernier. 

8. CCR telle que presente dans les cellules de luzerne ou de mais, et 
representee par SEQ ID NO 2 ou SEQ ID NO 4 respectivement, ou toute 
proteine derivee de ces dernieres, notamment par addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs acides amines, ou tout fragment issu 
desdites CCR ou de Ieurs sequences derivees, lesdits fragments et sequences 
derivees etant susceptible de posseder une activite enzymatique equivalente a 
celle des CCR susmentionnees. 

9. Sequences nucleotidiques codant pour les CCR representees par 
SEQ ID NO 2 ou SEQ ID NO 4, ou toute sequence derivee ou fragment de 
ces dernieres, selon la revendication 8. lesdites sequences nucleotidiques etant 
caracterisees en ce qu'elles correspondent a tout ou partie des sequences 
representees par SEQ ID NO 1 ou SEQ ID NO 3 respectivement, ou a toute 
sequence derivee de ces dernieres par degenerescence du code genetique, et 
etant neanmoins susceptibles de coder pour une CCR ou sequence derivee ou 
fragment de cette derniere, tels que definis dans la revendication 8. 

10. Complexes formes entre un ARNm antisens selon la revendication 7, 
et un ARNm selon la revendication 6. 



WO 97/12982 

PCT/FR96/01544 

70 - 



11. Sequence nucleotidique recombinante, caracterisee en ce qu'elle 
comprend au moins une sequence d'ADN selon Tune des revocations 2 et 
3, susceptible de coder pour un ARNm lui-meme susceptible de coder pour 
une CCR chez les plantes. ladite sequence selon Tune des revindications 2 et 3 
etant inseree dans une sequence heterologue. 

12. Sequence nucleotidique recombinante. caracterisee en ce qu'elle 
comprend au moins une sequence d'ADN complementatre selon 1'une des 
revendications 4 et 5. inseree dans une sequence heterolosue. ladite sequence 
d'ADN complementaire codant pour un ARNm amisens susceptible de 
s'hybnder avec l'ARNm codant pour une CCR chez les plantes. 

13. Sequence nucleotidique recombinante selon la re vendition 1 1 ou la 
revindication 12. caracterise en ce qu'elle comprend les elements necessaires 
pour reguler l'expression de la sequence nucleotidique selon 1'une des 
revendications 2 et 3. ou de sa sequence complementaire selon 1'une des 
revendications 4 et 5, notamment un promoteur et un termmateur de la 
transection de ces sequences, et le cas echeant, au moins une sequence 
d'ADN codant pour tout ou partie d'une autre enzyme que la CCR qui se 
trouve etre impliquee dans une etape de biosynthese des lienines chez les 
plantes. notamment l'ARNm codant lui-meme pour I'alcool cinmmvlique 
deshvdrogenase (CAD), ou au moins une sequence codant pour tout ou partie 
de l'ARNm antisens susceptible de s'hybrider avec l'ARNm susmentionne, 
notamment avec l'ARNm codant pour la CAD. 

14. Vecteur recombinant caracterise en ce qu'il comprend une sequence 
nucleotidique recombinante selon 1'une des revendications 11 a 13. integree 
dans run de ses sites de son genome non essentiels pour sa replication. 

15. Precede de regulation de la biosynthese de lignines chez les plantes 
sou par diminution, soit par augmentation des teneurs en lignines produites 
par rapport aux teneurs normales en lignines produites chez des plantes ledit 
precede comprenant une etape de transformation de cellules de ces plantes a 
l'aide d'un vecteur selon la revendication 14. 
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16. Procede de diminution de la biosynthese de lignine chez les plantes, 
et done de diminution des teneurs en lignines produites par rapport aux teneurs 
normales en lignines produites chez les plantes. caracterise en ce qu'il est 
effectue par transformation du genome de ces plantes, en y incorporant: 

- au moins une sequence d'ADN selon Tune des revindications 4 et 5, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d un ARNm antisens capable de s'hybrider a un ARNm codant pour une 
autre enzyme que la CCR, qui se trouve etre impliquee dans une etape de la 
biosynthese des lignines chez les plantes, notamment l'ARNm codant pour la 
CAD. 

ladite transformation etant realisee: 

- soil a I'aide d'un vecteur recombinant selon la revendication 14, 
contenant une sequence nucleotidique recombinante selon la revendication 12 
ou la revendication 13. 

- soit a Taide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence nucleotidique recombinante selon la revendication 12. 
tandis que 1* (ou les) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour un ARNm antisens capable de s'hybrider a un 
ARNm codant pour une autre enzyme que la CCR. telle que definie ci-dessus. 

17. Procede de diminution de la biosynthese de lignine chez les plantes, 
et done de diminution des teneurs en lignines produites par rapport aux teneurs 
normales en lignines produites chez les plantes, caracterise en ce qu'il est 
effectue par transformation du genome de ces plantes, en y incorporant: 

- au moins une sequence d'ADN selon la revendication 2 et 3, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d'une autre enzyme que la CCR, qui se trouve etre impliquee dans une 
etape de la biosynthese des lignines chez les plantes, notamment une sequence 
d'ADN codant pour tout ou partie de la CAD, 

ladite transformation etant realisee: 

- soit a I'aide d'un vecteur recombinant selon la revendication 14, 
contenant la sequence nucleotidique recombinante selon la revendication 11 ou 
la revendication 13, 

- soit a I'aide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence nucleotidique recombinante selon la revendication 11, 
tandis que I* (ou les) autre(s) vecteur(s) recombinants ) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR, 
telle que definie ci-dessus. 
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18. Precede d augmentation de la biosynthese de limine chez les 
plantes. et done d'augmentation des teneurs en lignines produites par ra Ppo „ 
aux teneurs normales en lignines produites chez les plantes. caracterise en ce 
qu'il est effecrue par transformation du genome de ces plantes. en y 

incorporant: 

- au moins une sequence d'ADN selon Tune des revindications 2 et 3, 

- et. le cas echeant, au moins une sequence d'ADN codant pour une 
autre enzyme que la CCR, qui Se trouve etre .mpliquee dans une etape de la 
b.osynthese des lignines chez les plantes. notamment une sequence d'ADN 
codant pour la CAD, 

ladite transformation etant realisee: 

- soil a I'aide d'un vecteur recombinant selon la revendication 14 
contenant la sequence nucleotidique recombinante selon la revendication 11 ou 
la revendication 13. 

- soit a I'aide de plusieurs vecteurs recomb.nants dont l un au moins 
contient une sequence nucleotidique recombinante selon la revendication 11 
tandis que 1' (ou les) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR. 
telle que definie ci-dessus. 

19. Plantes ou fragments de plantes, notamment cellules, fruits, 
semences, pollen, transforms par incorporation dans leur genome d'au moins 
une sequence nucleotidique selon Tune des revendications 2 a 5. 

20. Polypeptides recombinants, notamment CCR recombinantes 
representees par SEQ ID NO 2 ou SEQ ID NO 4, tels qu'obtenus par 
transformation de cellules vegetales en integrant de facon stable dans leur 
genome, une sequence nucleotidique recombinante selon 1'une des 
revendications 11 a 13. notamment a I'aide d'un vecteur selon la revendication 
14. 
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